Máte na telefonu hodinový rozhovor z minulého týdne. Tu schůzku jste si nahráli, abyste se mohli soustředit na to, co druhá strana říká, a nemuseli zběsile psát poznámky. Teď ten zvuk potřebujete přepsat do textu. Najdete online službu, nahrajete soubor a vyskočí na vás formulář: za přepis zaplaťte tolik a tolik, a mimochodem, citlivou nahrávku právě posíláte na cizí server někam do světa.
Existuje druhá cesta. Váš Mac to celé zvládne sám – offline, zdarma a bez toho, aby jediný bajt opustil váš počítač. Stačí jednou nastavit nástroj jménem Whisper a od té chvíle přepisujete cokoli kdykoli. Tento návod vás tím nastavením provede krok za krokem.
Co je Whisper a proč offline
Whisper je přepisovací model od OpenAI, tedy program, který z mluveného slova udělá text. To podstatné je, že běží přímo na vašem Macu. Nepotřebujete účet, předplatné ani připojení k internetu (kromě prvního stažení). Whisper umí dobře česky a zvládne i hodinové nahrávky.
A protože nic neodesílá na cizí server, vaše soubory zůstávají jen u vás na disku – žádná cloudová služba, žádné podmínky užití, žádné poplatky za minutu. Pro citlivé materiály, jako jsou pracovní schůzky, rozhovory nebo zdravotní záznamy, je právě tahle soukromost rozhodující.
Než začnete: co budete potřebovat
Stačí vám pár věcí:
- Mac – s procesorem Apple Silicon (M1 a novější) i starší s Intelem. Funguje obojí.
- Terminal – aplikace, kterou najdete přes Spotlight (Cmd + mezerník, napište „Terminal").
- Pár GB volného místa na disku – podle toho, jak přesný model si stáhnete.
- Trochu trpělivosti u prvního stažení – modely mají stovky MB až několik GB.
Nemusíte umět programovat. Všechny příkazy v tomto návodu jen zkopírujete do Terminálu a stisknete Enter. Nic víc.
Příprava prostředí: Homebrew, Python, ffmpeg
Začneme tím, že do Macu doplníme tři nástroje. Prvním je Homebrew – správce balíčků, přes který pak snadno doinstalujete vše ostatní. Otevřete Terminal a vložte tento příkaz:
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
Instalace chvíli trvá a může se zeptat na vaše heslo. Na konci Homebrew sám vypíše dva řádky, které máte spustit – zkopírujte je přesně podle toho, co vidíte na obrazovce. Na Macu s Apple Silicon to budou tyto dva řádky:
echo 'eval "$(/opt/homebrew/bin/brew shellenv)"' >> ~/.zprofile
eval "$(/opt/homebrew/bin/brew shellenv)"
Tento krok přidá Homebrew do takzvané PATH (seznamu míst, kde Mac hledá příkazy), aby Terminal příkaz brew našel. Na Intelovém Macu jsou cesty jiné, proto se vždy řiďte tím, co Homebrew vypíše. Že je vše v pořádku, ověříte takto:
brew --version
Měli byste vidět něco jako Homebrew 4.x.x. Teď přes Homebrew nainstalujte Python:
brew install python
A ověřte:
python3 --version
Nakonec nainstalujte ffmpeg. Ten je povinný – Whisper ho používá ke čtení zvuku z nahrávek:
brew install ffmpeg
Instalace Whisperu do virtuálního prostředí
Whisper nenainstalujeme přímo do systému, ale do takzvaného virtuálního prostředí (venv). Je to oddělený prostor pro Python balíčky, díky kterému neriskujete, že rozbijete systémový Python nebo jiné nástroje na Macu.
Vytvořte virtuální prostředí a aktivujte ho:
python3 -m venv ~/whisper-env
source ~/whisper-env/bin/activate
Po aktivaci se vám na začátku řádku v Terminálu objeví (whisper-env). To je znamení, že jste uvnitř prostředí. Teď nainstalujte samotný Whisper:
pip install openai-whisper
Instalace stáhne i potřebné knihovny, takže může chvíli trvat. Až doběhne, ověřte ji:
whisper --help
Pokud se vypíše nápověda s výčtem voleb, máte hotovo.
První přepis: základní příkaz
Tím je nastavení hotové a můžete přepisovat. Připravte si nějaký zvukový soubor – třeba nazev-souboru.mp3 – a spusťte:
whisper nazev-souboru.mp3
Při úplně prvním spuštění se Whisper na chvíli zastaví a stáhne si model. To se stane jen jednou; příště už použije stažený model okamžitě. Pak se v Terminálu začne postupně objevovat přepsaný text a vedle souboru vzniknou textové výstupy.
Čeština: vždy nastavte jazyk
Pokud jazyk neurčíte, Whisper ho hádá z prvních vteřin nahrávky – a u češtiny se občas splete, zvlášť když nahrávka začíná tichem nebo cizím slovem. Proto jazyk raději vždy nastavte:
whisper nazev-souboru.mp3 --language Czech
Funguje i kratší zápis --language cs. Výsledek je stejný, jen ušetříte pár znaků:
whisper nazev-souboru.mp3 --language cs
Volba modelu: tabulka a doporučení
Whisper nabízí několik modelů a každý je jiný kompromis mezi rychlostí a přesností. Menší modely běží rychle, ale dělají víc chyb; větší jsou přesnější, ale pomalejší a zaberou víc místa. Pokud parametr --model vůbec nezadáte, použije se od roku 2024 výchozí model turbo (velikost 809M) – je rychlý skoro jako small, ale přesností se blíží large. Konkrétní model zvolíte parametrem --model:
whisper nazev-souboru.mp3 --language Czech --model small
| Model | Přesnost | Rychlost | Kdy použít |
|---|---|---|---|
| tiny | ⭐ | ⚡⚡⚡⚡ | Rychlé testování (~75 MB) |
| base | ⭐⭐ | ⚡⚡⚡ | Jednoduché nahrávky (~142 MB) |
| small | ⭐⭐⭐ | ⚡⚡ | Dobrý výchozí bod (~466 MB) |
| turbo | ⭐⭐⭐⭐ | ⚡⚡ | Výchozí volba, rychlý i přesný (~809 MB) |
| medium | ⭐⭐⭐⭐ | ⚡ | Delší nebo složitější nahrávky (~1,5 GB) |
| large | ⭐⭐⭐⭐⭐ | 🐌 | Maximální přesnost (~3 GB) |
Model turbo má jediné omezení: neumí překlad. Pokud byste tedy chtěli přepis rovnou přeložit přes --task translate, sáhněte po jiném modelu.
Počítejte i s časem. Whisper na Macu běží na procesoru, takže u větších modelů (medium, large) může přepis trvat déle než samotná nahrávka. Pro běžné použití dávají nejlepší poměr rychlosti a přesnosti turbo nebo small.
Výstup: formáty a kam se ukládá
Whisper standardně vytvoří hned několik souborů: .txt s čistým textem, .srt a .vtt s titulky a časováním a .json s podrobnými daty. Když vám stačí jen prostý text, omezte výstup parametrem --output_format:
whisper nazev-souboru.mp3 --language Czech --output_format txt
Soubory se standardně ukládají do složky, ve které se zrovna nacházíte. Pokud je chcete poslat jinam, určete cíl přes --output_dir:
whisper nazev-souboru.mp3 --language Czech --output_dir ~/Desktop/prepisy
Whisper si poradí s běžnými formáty zvuku i videa – mimo jiné mp3, mp4, m4a, wav a ogg.
Každodenní používání
Virtuální prostředí platí jen pro aktuální okno Terminálu. Pokaždé, když otevřete nový Terminal, byste ho museli znovu aktivovat příkazem source ~/whisper-env/bin/activate – a teprve pak spustit přepis. To je při každodenním používání otravné. Nastavme si proto vlastní příkaz, který tu starost sundá z vašich beder.
Tímhle jedním řádkem přidáte na konec konfigurace shellu zsh funkci wt (zkratka pro „Whisper transcribe"):
cat >> ~/.zshrc <<'EOF'
wt() {
~/whisper-env/bin/whisper "$@"
}
EOF
Funkce volá Whisper přímo z virtuálního prostředí, takže ho ani nemusíte zvlášť aktivovat – a váš Terminal zůstává čistý. Aby se změna projevila, jednou načtěte konfiguraci (v dalších Terminálech už to dělat nemusíte):
source ~/.zshrc
Od teď máte v každém Terminálu příkaz wt, který vše za ním předá Whisperu. Přepis odkudkoli pak vypadá takto – přepnete se do složky se souborem a spustíte:
cd ~/Downloads
wt schuzka.mp4 --language Czech --model small --output_format txt
Zpracovat můžete i víc souborů najednou – buď je vyjmenujte, nebo použijte hvězdičku:
wt *.mp3 --language Czech
A to je celé. Žádné nahrávání, žádné čekání ve frontě, žádný formulář.
Když něco nefunguje (troubleshooting)
Většina potíží má jednoduchou příčinu. Tady jsou nejčastější:
command not found: whisper – voláte Whisper napřímo bez aktivace prostředí. Nejjednodušší je použít funkci wt (sahá na Whisper rovnou ve venv). Pokud chcete spouštět whisper, nejdřív aktivujte venv:
source ~/whisper-env/bin/activate
command not found: wt – funkci jste přidali, ale shell ji ještě nenačetl. Spusťte source ~/.zshrc, nebo otevřete nový Terminal.
command not found: brew – Homebrew není v PATH. Přidejte ho podle kroku s PATH výše a restartujte Terminal.
Přepis je nepřesný – zkuste větší model a ujistěte se, že máte nastavený jazyk:
whisper nazev-souboru.mp3 --language Czech --model medium
Pro maximální kvalitu sáhněte po --model large.
Instalace nebo první přepis trvá dlouho – to je v pořádku. Při prvním použití každého modelu se daný model stahuje (large má zhruba 3 GB). Jakmile je jednou na disku, další přepisy jsou okamžité.
Rychlý přehled příkazů
Tady je kompaktní tahák, který si můžete kdykoli zkopírovat:
# Jednorázové nastavení: přidejte funkci do ~/.zshrc a načtěte (source ~/.zshrc)
wt() {
~/whisper-env/bin/whisper "$@"
}
# Základní přepis
wt soubor.mp3 --language Czech
# Přepis s konkrétním modelem a výstupem
wt soubor.mp3 --language Czech --model small --output_format txt
# Uložení do složky
wt soubor.mp3 --language Czech --output_dir ~/Desktop/prepisy
Příště, až vám na telefonu přistane hodinový rozhovor nebo nahraná schůzka, neotevřete žádnou placenou službu a nikam nic nenahrajete – jen otevřete Terminal, spustíte wt a necháte svůj Mac, ať si s přepisem poradí sám. Soukromě a zadarmo.
