Use Windows system TTS for local mode

This commit is contained in:
2026-04-30 04:01:24 +09:00
parent dc39998241
commit 7ba392c0e7
7 changed files with 158 additions and 8 deletions

View File

@@ -6,7 +6,9 @@
- STT: `faster-whisper` + Whisper multilingual
- LLM: `Ollama` + `qwen3:0.6b`
- TTS: `kokoro-onnx` + `misaki[ko]`
- TTS:
- Windows: 시스템 기본 음성 엔진
- Linux/macOS: `kokoro-onnx` + `misaki[ko]`
- VAD: `avr-vad`
외부 유료 API나 무료 한도형 API는 쓰지 않습니다.
@@ -143,9 +145,11 @@ OLLAMA_MODEL=qwen3:1.7b
## Windows 메모
- `bun run devices` 와 Windows 로컬 녹음은 `ffmpeg`가 필요합니다.
- Windows는 TTS를 Python 모델 대신 시스템 기본 음성 엔진으로 처리합니다.
- 출력 장치 직접 선택은 아직 미구현이라 시스템 기본 출력 장치로 재생됩니다.
- Python 탐지가 안 되면 `.env``LOCAL_AI_PYTHON=python` 또는 `LOCAL_AI_PYTHON=py -3` 를 넣으면 됩니다.
- `setup:local-ai`Kokoro ONNX 모델 파일도 자동으로 내려받습니다.
- Windows의 `setup:local-ai`STT만 설치합니다.
- Linux/macOS의 `setup:local-ai`는 Kokoro ONNX 모델 파일도 자동으로 내려받습니다.
## 설계 메모