>백엔드 개발 >파이썬 튜토리얼 >저널 전사자: 받아쓰기하여 저널 쓰기

저널 전사자: 받아쓰기하여 저널 쓰기

DDD
DDD원래의
2024-11-29 10:00:17120검색

Journal Transcriber: Write journal by dictating it

안녕하세요

독자 여러분, 오늘은 제가 쓴 일지 대본에 대해 이야기하겠습니다. ?

내 생각을 저장하는 문제

제가 해결하려는 문제는 생각을 저장하고 싶다는 것입니다.

내가 쓴 글을 읽는 데에는 문제가 없지만 기다리는 것이 즐겁지는 않습니다. 받아쓰기는 할 수 있지만 내 목소리를 저장하거나 듣고 싶지는 않습니다.

저는 그런 상황이 닥칠 때마다 엔지니어링 모드로 들어가 작업 후 몇 시간 안에 해결할 수 있는 일이라면 달려갑니다.

초기 연구

먼저 사용하기 쉬운 음성-텍스트 라이브러리를 검색하다가 Vosk를 발견했습니다. 거대한 모델 라이브러리가 있습니다. 코딩하는 동안 앱을 사용하고 싶어서 작은 것 두 개를 선택했습니다. 어느 정도 괜찮은 결과를 보여줍니다.

파이썬 솔루션

그런 다음 여러 AI 모델의 마법을 사용하여 Python에서 솔루션을 찾았습니다. 내 마이크와 시스템 사운드를 Vosk 모델로 스트리밍하여 현재 날짜가 포함된 파일에 타임스탬프가 포함된 텍스트 변환을 제공합니다.

프로토타입부터 일상적인 사용성까지

목적은 맞지만 일상적으로 사용하기엔 불편해요. 내 모토 중 하나는 '쉽지 않고 즉각적이지 않으면 사용하지 않겠다'입니다. 그래서 스크립트를 Python 모듈에 압축하고 *.desktop 파일을 작성하여 제 경우에는 Pop!_OS 일반 리눅스 애플리케이션으로 등록했습니다.
간단한 추가 터치만으로 키보드 단축키를 추가하는 것만으로도 기적이 작동하는 것을 확인하실 수 있습니다!
알림 보내기를 사용한 알림을 통해 앱의 현재 상태를 알 수 있습니다.

콘솔 혼란 제거

저를 짜증나게 하는 한 가지는 애플리케이션이 콘솔에서 실행될 때 작업 공간이 복잡해지기 때문입니다. 이를 방지하려면 터미널에 의존하지 않고 앱을 시작하고 중지할 수 있는 간단한 방법이 필요했습니다. 내 해결책은 잠금 파일 시스템을 구현하는 것이었습니다.

앱이 시작되면 프로세스 ID(PID)가 포함된 잠금 파일이 생성됩니다. 잠금이 이미 존재하는 경우 스크립트는 이를 사용하여 KeyboardInterrupt 신호를 보내 실행 중인 인스턴스를 중지하고 종료합니다. 이런 식으로 첫 번째 호출에서는 앱이 시작되고 스크립트 작성이 시작되고, 두 번째 호출에서는 앱이 중지됩니다.

창의적인 방법으로 문제 해결

이 기사가 독특하고 창의적이며 다소 세련된 방식으로 자신의 문제를 해결하려는 누군가의 소망을 불러일으켰기를 바랍니다.

저의 다른 유사한 기사도 확인해 보세요.
스크린샷에서 텍스트 추출 자동화

코드도 확인해 보세요.
Github에서

좋은 하루 보내세요 ?

위 내용은 저널 전사자: 받아쓰기하여 저널 쓰기의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.