Linuxos alternatívát keresek WisprFlow helyett (system-wide Whisper diktálás)
Posted by _rrd_108@reddit | programmingHungary | View on Reddit | 7 comments
Sziasztok!
Szeretnék Linux alatt egy olyan diktálási megoldást összehozni, ami hasonló élményt nyújt, mint a WisprFlow. A cél az lenne, hogy bárhol, bármilyen szöveges mezőben (IDE, böngésző, Slack) tudjak diktálni egy globális shortcut segítségével.
Amit keresek:
- Nyelv: magyar és angol támogatás
- System-wide működés: Ne csak egy külön ablakba írjon, hanem "gépelje be" vagy illessze be a szöveget a fókuszban lévő mezőbe.
- Helyi futtatás: Elsősorban offline, local GPU-t használó megoldás érdekel (adatvédelem + latency miatt).
- Shortcut támogatás: Egy gombnyomásra induljon és álljon le a felvétel.
Próbáltam már pár scriptet és GitHubos projektet, de valahogy a Wayland + GNOME + Manjaro kombómnak egyik sem tetszett. Wayland alatt a legtöbb keyboard injection (mint az xdotool) elvérzik, a GNOME sandbox-os megközelítése és a Manjaro friss csomagjai miatt pedig sokszor a függőségekkel vagy a jogosultságokkal akadtam el.
Ti mit használtok Voice-to-Textre Linuxon, ha nem akartok a Google-nek/felhőnek adatot küldeni? Esetleg valami jól konfigurált whisper.cpp + systemd kombó valakinél?
Köszi a tippeket!
zieglerziga@reddit
https://github.com/cjpais/Handy
https://github.com/cjpais/Handy?tab=readme-ov-file#known-issues--current-limitations
EbbAppropriate9421@reddit
ugyanez a journey megvolt, rengeteg distro hopping után ( 3 hónap manjaro volt a legvége ) több éve linux mint megy nálam
s7stM@reddit
Vagy ha a GNOME mindenkepp tetszene, akkor Fedora is jatszhat.
BulkyDifficulty1628@reddit
Nem leszek nepszeru, de en tobbszor lepattantam waylandrol, amit irsz (xdotool es tarsai) kozismert, raadasul a vegtelenul bolcs gnome devek mar kipucoltak az x11 supportot. En biztos visszamennek x11-re (cinnamon, mate, xfce stb.) ha hekkelgetni akarok valami injection scripttel, ha nem, akkor kb. az a kerdes h gnome v kde accessibility nyujt-e valami ilyen opciot. Ha nyujt = orom, bodotta.
kontostamas@reddit
írj egyet claude-dal es dockerben futtasd, nekem tok jol mukodik
CryingPCUser@reddit
https://github.com/peteonrails/voxtype
Elég jól működik szerintem, angolul próbáltam csak.
OregonHu_@reddit
nézd meg (windowsost nem ismerem):
https://flathub.org/en/apps/net.mkiol.SpeechNote