Use Windows system TTS for local mode

2026-04-30 04:01:24 +09:00
parent dc39998241
commit 7ba392c0e7
7 changed files with 158 additions and 8 deletions
--- a/README.md
+++ b/README.md
@@ -6,7 +6,9 @@

 - STT: `faster-whisper` + Whisper multilingual
 - LLM: `Ollama` + `qwen3:0.6b`
- TTS: `kokoro-onnx` + `misaki[ko]`
+- TTS:
+- Windows: 시스템 기본 음성 엔진
+- Linux/macOS: `kokoro-onnx` + `misaki[ko]`
 - VAD: `avr-vad`

 외부 유료 API나 무료 한도형 API는 쓰지 않습니다.
@@ -143,9 +145,11 @@ OLLAMA_MODEL=qwen3:1.7b
 ## Windows 메모

 - `bun run devices` 와 Windows 로컬 녹음은 `ffmpeg`가 필요합니다.
+- Windows는 TTS를 Python 모델 대신 시스템 기본 음성 엔진으로 처리합니다.
 - 출력 장치 직접 선택은 아직 미구현이라 시스템 기본 출력 장치로 재생됩니다.
 - Python 탐지가 안 되면 `.env` 에 `LOCAL_AI_PYTHON=python` 또는 `LOCAL_AI_PYTHON=py -3` 를 넣으면 됩니다.
- `setup:local-ai`는 Kokoro ONNX 모델 파일도 자동으로 내려받습니다.
+- Windows의 `setup:local-ai`는 STT만 설치합니다.
+- Linux/macOS의 `setup:local-ai`는 Kokoro ONNX 모델 파일도 자동으로 내려받습니다.

 ## 설계 메모