ホームページ >バックエンド開発 >Python チュートリアル >Python プログラミングを使用して音声でコンピューターを制御する
コンピューターの前で、コンピューターに命令を受けさせたいですか?疲れたときに「疲れた」と言うだけで、コンピューターが上品な軽やかな音楽を流してリラックスさせてくれます。 忙しいスケジュールの合間に、コンピュータ担当者に最新の NBA スコアを読んでもらいたいと思うかもしれません...すべてがとても快適です。
私がここで言いたいのは、落胆しないでください、本当にそれを作ることができるということです。
音声認識を行いますか? ここに来る人は、好奇心とそれを避けるという2つの心理を抱えていると思います。
実際には、それほど多くのプログラミング スキルを知る必要はなく、自然言語処理テクノロジを知る必要もありません。この記事では音声制御を実装していますが、決してそのようなものではありません。思った通り複雑。 音声認識が実装されたインターフェイスとしてのみ使用される場合、残りのロジックは IF-ELSE などの単純な要素だけです。
音声制御の原理
音声制御は、音声認識と音声読み上げの 2 つの部分に分かれています。
これら 2 つの部分には、本来、自然言語処理スキルと一連の非常に複雑なアルゴリズムの知識が必要ですが、アルゴリズムと自然言語学のみに興味がある場合は、この記事は省略しますので、そのまま先に進んでください。以下の内容については一言も触れません。
IBM は 1990 年代に非常に強力な音声認識システム vio voice を発売して以来、関連製品が際限なく登場し、常に進化しています。 ここでは SAPI を使用して音声モジュールを実装します。
SAPI とは何ですか?
SAPI は Microsoft Speech API であり、Microsoft によって開始された音声インターフェイスです。WINXP 以降、システムにはすでに音声認識機能が備わっていますが、その機能を提供する余地はほとんどありません。ユーザーフレンドリーなカスタマイズソリューションですが、唯一の音声制御コマンドは非常に威圧的です。 この記事の目的は、SAPI を使用してパーソナライズされた音声認識を行うことです。
準備段階では、少なくとも次のツールをインストールする必要があります:
Python2.7 http://www.python.org/
2.7 を使用することを強くお勧めします。これまでのところ、Python 2.7 は Python シリーズの中で最も多くのツールとアプリケーションをサポートしており、比較的安定しています。
Win32Com http://starship.python.net/~skippy/win32/Downloads.html
Python Win32 拡張ツールにより、Python で WIN32COM インターフェイスを呼び出すことができます。このツールの登場により、Python は非常に強力になりました。
Speech.py http://pypi.python.org/pypi/speech/
これは非常に合理化されたパッケージ モジュールです。もちろん、これを再発明することはお勧めしません。ただし、落胆しないでください。 Python2.6 と Python2.7 のコードは互換性があり、例外はありません。
インストールプロセス中は上から順に実行してください。
開発段階
上記の関連ツールをインストールすると、以下を開発できます:
最初に簡単な環境のデバッグを実行します:
1. 中国語セマンティック ライブラリを定義します
2. 関連するセマンティック操作ロジックを定義します
3. プログラム実行本体をビルドします
このセクションは、音声モニタリングをオンにし、端末入力モードをサポートするという操作の本体です。声がかすれている場合は、文字を入力することもできます、はは~~