音声認識の進歩により、機械が人間の声を認識しアクションを起こすことが家庭用の機器で手軽にできる世の中になっています。そこで化学に関する言葉もちゃんと認識されるか、アマゾン・アレクサにいろいろな化合物や化合物を伝える実験を行いました。
はじめに
Amazon アレクサをインストールしたスマホやホーム機器では、声で物事を調べたり、家電の操作、ネット注文ができます。これは、人間の声を音声認識によって文字に変換し、それを元にネットを検索したり、別の機器の指示信号の出力を行うことができるからです。筆者は、ManomaというSonyのスマートホームサービスでアレクサの機能を使用しておりますが、日常で使う言葉は大抵認識してくれ、テレビやエアコンをつけるときに声で操作でき重宝しています。日常の用語ではなく、分子名や反応名、分析機器の名前などもちゃんと認識してくれるのでしょうか。ということで実際にアレクサにいろいろな用語を話しかけてどのような反応になるのか調べてみました。
スピーカーの音をスマホで録音したので雑音が入ってしまっています、申し訳ございません。またヘリウムを吸ってしまい声が高くなっています(嘘)。
物質名の場合
まず、化合物の名前を認識して調べてくれるかを確かめるために「XXXって何?」と聞いてみました。
まずエタノールですが、しっかりと認識されました。
音声プレーヤー一般的な溶媒(アセトン・メタノール)も問題なく認識されますが、解説文の漢字の読みが誤っているときがあります。
「アセトン」
音声プレーヤー「メタノール」最後は何言っているかよくわかりません。
音声プレーヤー次にDMSOを試しました。「ジメチルスルホキシド」と「D・M・S・O」では正しく認識されましたが、
「ジメチルスルホキシド」
音声プレーヤー「D・M・S・O」
音声プレーヤー「ディムソー」では、正しく認識されませんでした。自分の発音が悪いのかもしれません。
音声プレーヤーTHFの場合「テトラヒドロフラン」少し嚙んでも認識されましたが、
音声プレーヤー「T・H・F」は二回やってもダメでした。残念。
音声プレーヤー元素名も調べてみました。元素記号の下の方も認識されますが、
「オスミウム」
音声プレーヤー「タングステン」
音声プレーヤー「フランシウム」
音声プレーヤー元素であれば認識されましたが、「ホルミウム」や「ジスプロシウム」といったマイナーな希土類元素は認識されませんでした。ジスプロシウムは磁石に使われているほど有名です!
音声プレーヤー次にハロゲン化物を調べました。フルオロスルホン酸は認識されましたが、
音声プレーヤーフッ酸は、人名関連の言葉に間違えられることもあります。
音声プレーヤーフルオロメタンは、認識されませんでした。ゆっくりしゃべりましたが結果は変わりませんでした。
音声プレーヤー1-ブタノールはうまくいきませんでした。よく考えたらハイフンは読まないので認識されなくて当然かもしれません。
音声プレーヤー慣用名の場合、有名な化合物であれば認識されますが、Wikipediaがトップに検索されない化合物は認識されませんでした。
「メラトニン」
音声プレーヤー「スピノシン」「アスパラプチン」アレクサ、ケムステ読んで勉強してね!
音声プレーヤー「ギンコライド」銀行ではありません。
音声プレーヤー反応名・化学用語の場合
まずは成功例から
「核磁気共鳴分光法」
音声プレーヤー「ヘック反応」認識はされますが、有機ハロゲンばけもの(笑)
音声プレーヤー残念ながら有名な反応や用語でも認識されませんでした。
「スワーン酸化」
音声プレーヤー「円二色性」間違った引用元のリンクを読み上げるほうが長い・・・
音声プレーヤーこのようにある程度有名な言葉は、正しく認識されて調べた結果が出力されますが、すこしマイナーな化合物や用語になると一般的な用語を当てつけるような挙動がみられました。また、Wikipediaに掲載されているような言葉でも単語が長いと正しく認識されませんでした。専門用語の音声で完璧に理解するにはもう少し技術の発達が必要なのかもしれません。
翻訳機能を試す
アレクサには日本語の単語を英語に翻訳する機能があり例えば、
音声プレーヤーという風にネイティブな発音で返してくれます。これを化合物でやってみました。長くなってきたので失敗例のみ紹介します。塩化メチレンがえんかみちこいになってしまいました。
音声プレーヤー注文機能を試す
アレクサにはAmazonに注文できる機能があります。これで試薬や実験器具を注文できないか試してみました。酢酸ナトリウムは問題なく注文できるようです。
[amazonjs asin=”B07BKTPV7Y” locale=”JP” title=”酢酸ナトリウム500g(無水)【食品添加物】”] 音声プレーヤービーカーも注文できます。
[amazonjs asin=”B07CZN91N1″ locale=”JP” title=”柴田科学 ビーカー 目安目盛付き 100mL 6-214-03″] 音声プレーヤーしかし、ロータリーエバポレーターは認識されませんでした。
[amazonjs asin=”B06XXJVX7D” locale=”JP” title=”DLABDLAB ロータリーエバポレーター 縦型 /3-7048-01″] 音声プレーヤー最後にAmazonで売っている、とんでもなく高価な器具も注文できるのか試してみました。エアシャワーは、まさかの100万円越えですが淡々と金額を読んでカートに入れてしまいました。
[amazonjs asin=”B07WZBTWLC” locale=”JP” title=”アズワン エアシャワー PSAS-T91PSL-E”] 音声プレーヤー今回は、予め売っている製品の名前をAmazonで調べてからアレクサに問いかけたので、正しい認識が多かったのかもしれません。そのため、AmzonのCMのように漠然と実験中に足りなくなったものを声で注文するのは難しそうです。
アレクサの逆襲
偉そうにアレクサをテストしているが、そういうお前はちゃんと化学を知っているのか?ということでアレクサの逆襲が始まりました。
まじめな話、スマホにアプリをインストールするようにアレクサにもスキルを追加する機能があります。その中に、進研ゼミ高校講座さんが作成した「放課後、わたしと化学1問1答」というスキルがあり、これをインストールすると化学のクイズで遊ぶことができます。あなたは憧れのセンパイが作った「化学クラブ」への入部するために、アレクサが出題するクイズに100問連続正解しなくてはなりません。
[amazonjs asin=”B07BHC1XZJ” locale=”JP” title=”放課後、わたしと化学1問1答”] 音声プレーヤー問題は、センター試験基礎レベルの化学だそうです。2回連続の不正解でチャレンジは終了となります。緊張の第一問は、簡単な二択で助かりました。ほとんどが2択ですが、ときどき自由回答の問題も出題されます。
音声プレーヤー5問目以降はテンポになれ、第十問まで難なくクリアしました。センパイ、化学好きです(笑)。
音声プレーヤー第15問で2択問題を間違えました。アレクサは淡々と指摘します。
音声プレーヤーこれなら100問まで余裕だろと思っていたら、まさかの電気親和力を答えられず挑戦終了。ああ、恥ずかしい。
音声プレーヤーレビューには苦戦しているコメントが寄せられているので、化学を専門にしていても簡単ではないようです。自分のアレクサにはモニタが無いので、聞き取りだけである状況がより難しくしています(言い訳)。モニタがあるデバイスを使うと読み上げるスクリプトが画面に表示されるようです。また、レビューにはアレクサが正しく認識してくれず不正解になったとの声もあり、問題の解答によっては上記で試したように認識が難しいのかもしれません。
まとめ
結果をまとめると、アレクサはまあまあ化学を知っているといったところでしょうか。これは大変くだらない企画でしたが、まじめなことを考えると専門用語の音声認識は、日常会話よりも使われる頻度はずっと少なく需要は高くないと思います。しかし、専門用語が人の理解や行動を妨げている場合もあり、音声認識によってその壁を取り除くことができると予想されます。また、一つの音声認識システムが全ての専門用語をカバーする必要はなく、状況に応じて専門分野を認識し、分野に応じてシステム自体が変われば、誤認識や誤発声も少なくなるかもしれません。