Whisper na Macu – průvodce instalací a používáním

Whisper na Macu – průvodce instalací a používáním

Přepisujte schůzky a rozhovory do textu přímo na svém Macu – offline, zdarma a v češtině. Návod krok za krokem od instalace Homebrew po první hotový přepis, bez nahrávání citlivých dat na cizí servery.

Jakub Kontra
Jakub Kontra
Developer

Máte na telefonu hodinový rozhovor z minulého týdne. Tu schůzku jste si nahráli, abyste se mohli soustředit na to, co druhá strana říká, a nemuseli zběsile psát poznámky. Teď ten zvuk potřebujete přepsat do textu. Najdete online službu, nahrajete soubor a vyskočí na vás formulář: za přepis zaplaťte tolik a tolik, a mimochodem, citlivou nahrávku právě posíláte na cizí server někam do světa.

Existuje druhá cesta. Váš Mac to celé zvládne sám – offline, zdarma a bez toho, aby jediný bajt opustil váš počítač. Stačí jednou nastavit nástroj jménem Whisper a od té chvíle přepisujete cokoli kdykoli. Tento návod vás tím nastavením provede krok za krokem.

Co je Whisper a proč offline

Whisper je přepisovací model od OpenAI, tedy program, který z mluveného slova udělá text. To podstatné je, že běží přímo na vašem Macu. Nepotřebujete účet, předplatné ani připojení k internetu (kromě prvního stažení). Whisper umí dobře česky a zvládne i hodinové nahrávky.

A protože nic neodesílá na cizí server, vaše soubory zůstávají jen u vás na disku – žádná cloudová služba, žádné podmínky užití, žádné poplatky za minutu. Pro citlivé materiály, jako jsou pracovní schůzky, rozhovory nebo zdravotní záznamy, je právě tahle soukromost rozhodující.

Než začnete: co budete potřebovat

Stačí vám pár věcí:

  • Mac – s procesorem Apple Silicon (M1 a novější) i starší s Intelem. Funguje obojí.
  • Terminal – aplikace, kterou najdete přes Spotlight (Cmd + mezerník, napište „Terminal").
  • Pár GB volného místa na disku – podle toho, jak přesný model si stáhnete.
  • Trochu trpělivosti u prvního stažení – modely mají stovky MB až několik GB.

Nemusíte umět programovat. Všechny příkazy v tomto návodu jen zkopírujete do Terminálu a stisknete Enter. Nic víc.

Příprava prostředí: Homebrew, Python, ffmpeg

Začneme tím, že do Macu doplníme tři nástroje. Prvním je Homebrew – správce balíčků, přes který pak snadno doinstalujete vše ostatní. Otevřete Terminal a vložte tento příkaz:

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

Instalace chvíli trvá a může se zeptat na vaše heslo. Na konci Homebrew sám vypíše dva řádky, které máte spustit – zkopírujte je přesně podle toho, co vidíte na obrazovce. Na Macu s Apple Silicon to budou tyto dva řádky:

echo 'eval "$(/opt/homebrew/bin/brew shellenv)"' >> ~/.zprofile
eval "$(/opt/homebrew/bin/brew shellenv)"

Tento krok přidá Homebrew do takzvané PATH (seznamu míst, kde Mac hledá příkazy), aby Terminal příkaz brew našel. Na Intelovém Macu jsou cesty jiné, proto se vždy řiďte tím, co Homebrew vypíše. Že je vše v pořádku, ověříte takto:

brew --version

Měli byste vidět něco jako Homebrew 4.x.x. Teď přes Homebrew nainstalujte Python:

brew install python

A ověřte:

python3 --version

Nakonec nainstalujte ffmpeg. Ten je povinný – Whisper ho používá ke čtení zvuku z nahrávek:

brew install ffmpeg

Instalace Whisperu do virtuálního prostředí

Whisper nenainstalujeme přímo do systému, ale do takzvaného virtuálního prostředí (venv). Je to oddělený prostor pro Python balíčky, díky kterému neriskujete, že rozbijete systémový Python nebo jiné nástroje na Macu.

Vytvořte virtuální prostředí a aktivujte ho:

python3 -m venv ~/whisper-env
source ~/whisper-env/bin/activate

Po aktivaci se vám na začátku řádku v Terminálu objeví (whisper-env). To je znamení, že jste uvnitř prostředí. Teď nainstalujte samotný Whisper:

pip install openai-whisper

Instalace stáhne i potřebné knihovny, takže může chvíli trvat. Až doběhne, ověřte ji:

whisper --help

Pokud se vypíše nápověda s výčtem voleb, máte hotovo.

První přepis: základní příkaz

Tím je nastavení hotové a můžete přepisovat. Připravte si nějaký zvukový soubor – třeba nazev-souboru.mp3 – a spusťte:

whisper nazev-souboru.mp3

Při úplně prvním spuštění se Whisper na chvíli zastaví a stáhne si model. To se stane jen jednou; příště už použije stažený model okamžitě. Pak se v Terminálu začne postupně objevovat přepsaný text a vedle souboru vzniknou textové výstupy.

Čeština: vždy nastavte jazyk

Pokud jazyk neurčíte, Whisper ho hádá z prvních vteřin nahrávky – a u češtiny se občas splete, zvlášť když nahrávka začíná tichem nebo cizím slovem. Proto jazyk raději vždy nastavte:

whisper nazev-souboru.mp3 --language Czech

Funguje i kratší zápis --language cs. Výsledek je stejný, jen ušetříte pár znaků:

whisper nazev-souboru.mp3 --language cs

Volba modelu: tabulka a doporučení

Whisper nabízí několik modelů a každý je jiný kompromis mezi rychlostí a přesností. Menší modely běží rychle, ale dělají víc chyb; větší jsou přesnější, ale pomalejší a zaberou víc místa. Pokud parametr --model vůbec nezadáte, použije se od roku 2024 výchozí model turbo (velikost 809M) – je rychlý skoro jako small, ale přesností se blíží large. Konkrétní model zvolíte parametrem --model:

whisper nazev-souboru.mp3 --language Czech --model small
ModelPřesnostRychlostKdy použít
tiny⚡⚡⚡⚡Rychlé testování (~75 MB)
base⭐⭐⚡⚡⚡Jednoduché nahrávky (~142 MB)
small⭐⭐⭐⚡⚡Dobrý výchozí bod (~466 MB)
turbo⭐⭐⭐⭐⚡⚡Výchozí volba, rychlý i přesný (~809 MB)
medium⭐⭐⭐⭐Delší nebo složitější nahrávky (~1,5 GB)
large⭐⭐⭐⭐⭐🐌Maximální přesnost (~3 GB)

Model turbo má jediné omezení: neumí překlad. Pokud byste tedy chtěli přepis rovnou přeložit přes --task translate, sáhněte po jiném modelu.

Počítejte i s časem. Whisper na Macu běží na procesoru, takže u větších modelů (medium, large) může přepis trvat déle než samotná nahrávka. Pro běžné použití dávají nejlepší poměr rychlosti a přesnosti turbo nebo small.

Výstup: formáty a kam se ukládá

Whisper standardně vytvoří hned několik souborů: .txt s čistým textem, .srt a .vtt s titulky a časováním a .json s podrobnými daty. Když vám stačí jen prostý text, omezte výstup parametrem --output_format:

whisper nazev-souboru.mp3 --language Czech --output_format txt

Soubory se standardně ukládají do složky, ve které se zrovna nacházíte. Pokud je chcete poslat jinam, určete cíl přes --output_dir:

whisper nazev-souboru.mp3 --language Czech --output_dir ~/Desktop/prepisy

Whisper si poradí s běžnými formáty zvuku i videa – mimo jiné mp3, mp4, m4a, wav a ogg.

Každodenní používání

Virtuální prostředí platí jen pro aktuální okno Terminálu. Pokaždé, když otevřete nový Terminal, byste ho museli znovu aktivovat příkazem source ~/whisper-env/bin/activate – a teprve pak spustit přepis. To je při každodenním používání otravné. Nastavme si proto vlastní příkaz, který tu starost sundá z vašich beder.

Tímhle jedním řádkem přidáte na konec konfigurace shellu zsh funkci wt (zkratka pro „Whisper transcribe"):

cat >> ~/.zshrc <<'EOF'
wt() {
  ~/whisper-env/bin/whisper "$@"
}
EOF

Funkce volá Whisper přímo z virtuálního prostředí, takže ho ani nemusíte zvlášť aktivovat – a váš Terminal zůstává čistý. Aby se změna projevila, jednou načtěte konfiguraci (v dalších Terminálech už to dělat nemusíte):

source ~/.zshrc

Od teď máte v každém Terminálu příkaz wt, který vše za ním předá Whisperu. Přepis odkudkoli pak vypadá takto – přepnete se do složky se souborem a spustíte:

cd ~/Downloads
wt schuzka.mp4 --language Czech --model small --output_format txt

Zpracovat můžete i víc souborů najednou – buď je vyjmenujte, nebo použijte hvězdičku:

wt *.mp3 --language Czech

A to je celé. Žádné nahrávání, žádné čekání ve frontě, žádný formulář.

Když něco nefunguje (troubleshooting)

Většina potíží má jednoduchou příčinu. Tady jsou nejčastější:

command not found: whisper – voláte Whisper napřímo bez aktivace prostředí. Nejjednodušší je použít funkci wt (sahá na Whisper rovnou ve venv). Pokud chcete spouštět whisper, nejdřív aktivujte venv:

source ~/whisper-env/bin/activate

command not found: wt – funkci jste přidali, ale shell ji ještě nenačetl. Spusťte source ~/.zshrc, nebo otevřete nový Terminal.

command not found: brew – Homebrew není v PATH. Přidejte ho podle kroku s PATH výše a restartujte Terminal.

Přepis je nepřesný – zkuste větší model a ujistěte se, že máte nastavený jazyk:

whisper nazev-souboru.mp3 --language Czech --model medium

Pro maximální kvalitu sáhněte po --model large.

Instalace nebo první přepis trvá dlouho – to je v pořádku. Při prvním použití každého modelu se daný model stahuje (large má zhruba 3 GB). Jakmile je jednou na disku, další přepisy jsou okamžité.

Rychlý přehled příkazů

Tady je kompaktní tahák, který si můžete kdykoli zkopírovat:

# Jednorázové nastavení: přidejte funkci do ~/.zshrc a načtěte (source ~/.zshrc)
wt() {
  ~/whisper-env/bin/whisper "$@"
}

# Základní přepis
wt soubor.mp3 --language Czech

# Přepis s konkrétním modelem a výstupem
wt soubor.mp3 --language Czech --model small --output_format txt

# Uložení do složky
wt soubor.mp3 --language Czech --output_dir ~/Desktop/prepisy

Příště, až vám na telefonu přistane hodinový rozhovor nebo nahraná schůzka, neotevřete žádnou placenou službu a nikam nic nenahrajete – jen otevřete Terminal, spustíte wt a necháte svůj Mac, ať si s přepisem poradí sám. Soukromě a zadarmo.