🎙️ 무료 · Windows 10/11🌏 한국어·영어·중국어·일본어🌐 오픈소스 (GitHub)

텍스트·자막을 MP3 음성으로,
무료 텍스트 음성 변환기 (TTS)

일반 텍스트나 자막 파일(.srt/.vtt) 을 Microsoft Edge 신경망 TTS 로 자연스러운 MP3 음성으로 변환하는 무료 텍스트 음성 변환기입니다. 한국어·영어·중국어·일본어 지원, 가입·로그인·API 키 전부 없이 12MB 인스톨러 한 개로 끝. 유튜브 더빙, 강의 멘트, 오디오북 제작에 바로 쓰세요.

다운로드 (설치형 · 64-bit · v0.1.0)소스 코드 (GitHub)

Windows 10 (1803+) / 11 (64-bit) · 별도 런타임 불필요 · MP3 생성 시 인터넷 필요. 전체 릴리스

▶ 동작 데모 — 텍스트·자막 → MP3 흐름

아래는 실제 앱의 사용 흐름을 그대로 재현한 인터랙티브 데모입니다. 텍스트 입력 → 미리듣기 → MP3 저장 → 자막(.srt) 드래그앤드롭 → 자동 추출 → MP3 저장 까지 자동으로 순환됩니다. 다운로드 전에 한 번 보시면 감이 옵니다.

실제 실행 화면

Voxsave 메인 화면 — 텍스트·자막 입력과 음성/속도/음높이 컨트롤

텍스트 입력란, 자막 드롭존, 음성·속도·음높이 컨트롤, 미리듣기와 저장 버튼이 한 화면에 모여 있어 처음 켠 직후 1분 안에 첫 MP3 가 나옵니다.

왜 만들었나

기존 무료 TTS 서비스들은 한국어 발음이 어색하거나, 글자 수 제한이 있거나, 회원 가입·API 키 발급을 요구합니다. 영상 한 편 더빙하려고 결제 페이지에 카드 정보부터 넣게 되는 흐름이 늘 부담스러웠습니다.

Voxsave 는 Microsoft Edge 의 신경망 TTS 를 로컬에서 호출하는 가벼운 데스크탑 래퍼입니다. 인스톨러 한 개를 받고 더블클릭하면 끝. 가입도, 토큰도, 글자 수 제한도 없습니다.

누구에게 좋은가

유튜브 크리에이터 — 한국어 더빙·내레이션·자막 음성 변환. 성우 비용 0원
강사·발표자 — 강의 자료·발표 자료의 안내 멘트, 자동 응대 음성 멘트
오디오북·팟캐스트 작가 — 대본 시제품, 첫 회차 데모. 출연료 없이 분량 검증
접근성 — 시각장애가 있는 가족·동료를 위해 글을 음성으로 변환해 전달
학습자 — 영어 본문을 한국어로 번역해 출퇴근 청취용 오디오로 만들기

다운로드 & 설치

위 다운로드 버튼 또는 GitHub Releases 에서 Voxsave_0.1.0_x64-setup.exe 한 개만 받으면 됩니다. 약 12MB.

Windows 10 (1803+) / 11 (64-bit)
WebView2 (Win11 기본 탑재, Win10 1803+ 포함 / 없으면 설치 프로그램이 자동 다운로드)
MP3 생성 시 인터넷 필요 (Microsoft Edge TTS 서버 호출)
Python / Node / Rust 불필요 — 빌드 전용 도구

Windows SmartScreen 이 “PC를 보호했습니다” 경고를 띄울 수 있습니다. 코드 서명 안 된 무료 앱이라 정상입니다. 추가 정보 → 실행 으로 넘어가시면 됩니다.

30초 만에 첫 MP3 만들기

1단계 — 텍스트 입력 또는 자막 드래그

상단 탭 [01] 텍스트 에 변환할 문장을 입력하거나, [02] 자막파일 (.srt / .vtt) 탭의 드롭존에 자막 파일을 끌어다 놓으면 타임코드·번호·HTML 태그가 자동으로 제거되고 대사만 추출됩니다.

2단계 — 음성·속도·음높이 선택

음성 — 한국어 3종(SunHi 여성, InJoon 남성, Hyunsu 다국어) + 영·일·중 등 추가 언어
속도 — -50% ~ +100% (학습용 -10%, 빠른 리뷰 +30% 추천)
음높이 — -50Hz ~ +50Hz (캐릭터 보이스에 ±20Hz)

3단계 — 미리듣기

▶ 미리듣기 버튼을 누르면 저장될 결과와 동일한 음질 로 재생됩니다. 마음에 들면 그대로 저장됩니다.

4단계 — MP3 로 저장

⬇ MP3로 저장 누르고 위치 선택. 보통 3초 안에 저장 완료. 자막 한 편(예: 1500줄, 5,000+자) 도 한 번에 변환 가능합니다.

💡 자막에 <i>, <font> 같은 HTML 태그나 Aegisub 의 {\an8} 같은 ASS 스타일 태그가 들어 있어도 깨끗이 정리됩니다.

활용 예시

유튜브 영상 더빙

자막 파일(.srt) 을 준비해 자막 탭에 드래그 → SunHi 음성, +5% 속도로 저장 → 결과 MP3 를 영상 편집 프로그램(프리미어/다빈치)에 음성 트랙으로 추가. 성우 섭외 비용·일정 부담 없이 한 시간 분량 영상을 오늘 안에 더빙할 수 있습니다.

발표·강의 안내 멘트

짧은 문장을 여러 개 만들어 안내 멘트 풀로 사용. 매번 녹음실 잡아 녹음할 필요 없이 슬라이드 옆에 mp3 한 줄로 끝납니다.

학습 자료

영어 본문을 한국어로 번역해 InJoon(남성) 음성으로 만들어 출퇴근 시간에 청취. TextBook → MP3 흐름이 한 화면에서 끝나니 책을 통째로 오디오북으로 만들기 좋습니다.

오디오북·팟캐스트 시제품

대본을 통째로 입력해 첫 회차 데모 제작. 출연료 0원으로 분량과 전달력을 먼저 검증한 뒤 본녹음에 들어갈 수 있습니다.

내부 동작 — Tauri + edge-tts 사이드카

Voxsave 는 Tauri v2 (Rust + WebView2) 기반 데스크탑 앱입니다. 웹 UI 에서 입력한 텍스트는 Rust 백엔드로 전달되고, PyInstaller 로 동봉된 edge-tts 사이드카가 Microsoft Edge TTS 를 호출해 MP3 를 직접 저장합니다.

[웹 UI (HTML/JS)]
  └─ invoke('synthesize', {text, voice, rate, pitch, out})
        ▼
[Rust 백엔드]
  ├─ text → UTF-8 임시 .txt 저장
  ├─ shell sidecar 실행
  └─ 임시파일 삭제 후 결과 반환
        ▼
[edge-tts 사이드카 (.exe)]
  └─ Microsoft Edge 신경망 TTS → MP3 직접 저장

미리듣기는 별도 경로(Web Speech API) 로 OS 음성을 즉시 재생하므로 인터넷 없이도 사용 가능합니다. 최종 MP3 만 edge-tts 클라우드를 거칩니다. 전체 소스코드는 GitHub 에 공개돼 있습니다.

지원 음성 — 한국어·영어·중국어·일본어

앱의 음성 선택 목록 그대로입니다. 4개 언어 · 10개 음성을 바로 고를 수 있습니다.

음성	Voice ID	성별
🇰🇷 한국어
SunHi	ko-KR-SunHiNeural	여성 · 기본
InJoon	ko-KR-InJoonNeural	남성
Hyunsu	ko-KR-HyunsuMultilingualNeural	남성 · 다국어
🇺🇸 English (US)
Aria	en-US-AriaNeural	여성
Guy	en-US-GuyNeural	남성
Jenny	en-US-JennyNeural	여성
🇯🇵 日本語
Nanami	ja-JP-NanamiNeural	女性 (여성)
Keita	ja-JP-KeitaNeural	男性 (남성)
🇨🇳 中文
Xiaoxiao	zh-CN-XiaoxiaoNeural	女 (여성)
Yunxi	zh-CN-YunxiNeural	男 (남성)

그 외 수십 개 언어·음성도 사이드카 --list 옵션으로 모두 확인·선택할 수 있습니다.

자주 묻는 질문

Q. 인터넷 없이 쓸 수 있나요?

미리듣기는 OS 음성으로 오프라인 재생되지만, MP3 저장은 인터넷이 필요합니다. edge-tts 가 Microsoft 의 TTS 서버를 호출하기 때문입니다. 앱 자체는 오프라인이고, 음성 합성만 클라우드에서 처리됩니다.

Q. 글자 수 제한이 있나요?

edge-tts 자체에는 사실상 제한이 없습니다. 자막 한 편(예: 영화 자막 1500줄, 5,000+자) 도 한 번에 변환됩니다.

Q. 상업적으로 써도 되나요?

Microsoft Edge TTS 의 약관을 따릅니다. 일반적으로 개인·상업 콘텐츠 모두에 사용 가능하지만, 큰 프로젝트 전에는 Microsoft 공식 라이선스 페이지를 한 번 확인하세요.

Q. macOS / Linux 버전은요?

현재 Windows 전용입니다. Tauri 기반이라 macOS / Linux 빌드도 구조상 가능하며 향후 릴리스 예정입니다.

Q. 음성이 잘려 나옵니다.

긴 텍스트는 마지막 마침표 뒤에 빈 줄 한두 줄을 추가해 보세요. 또는 문단 단위로 나눠 저장 후 합치는 방식이 안전합니다.

Q. SmartScreen 이 차단합니다.

코드 서명 안 된 무료 앱이라 정상입니다. 추가 정보 → 실행 으로 넘어가세요. 출처가 의심된다면 공개 소스코드 에서 직접 빌드도 가능합니다.

🎙️ 무료 · 오픈소스 · 광고 없음

한국어 TTS 에 결제·가입의 부담을 없애기 위해 만들었습니다. 영상 한 편 더빙, 강의 한 슬라이드 안내 멘트, 책 한 권 오디오북 — 결제 창 안 보고 끝까지 가실 수 있어요.

소스 코드·이슈 제보: github.com/cflab2017/Tool_Voxsave

도움이 되셨다면 ❤️ 응원해 주세요

작은 금액도 큰 힘이 됩니다. 광고·결제 수수료 없이 직접 전달돼요.

PayPal로 기부

해외 카드/계좌

텍스트·자막을 MP3 음성으로,무료 텍스트 음성 변환기 (TTS)