音声認識の進歩により、機械が人間の声を認識しアクションを起こすことが家庭用の機器で手軽にできる世の中になっています。そこで化学に関する言葉もちゃんと認識されるか、アマゾン・アレクサにいろいろな化合物や化合物を伝える実験を行いました。
はじめに
Amazon アレクサをインストールしたスマホやホーム機器では、声で物事を調べたり、家電の操作、ネット注文ができます。これは、人間の声を音声認識によって文字に変換し、それを元にネットを検索したり、別の機器の指示信号の出力を行うことができるからです。筆者は、ManomaというSonyのスマートホームサービスでアレクサの機能を使用しておりますが、日常で使う言葉は大抵認識してくれ、テレビやエアコンをつけるときに声で操作でき重宝しています。日常の用語ではなく、分子名や反応名、分析機器の名前などもちゃんと認識してくれるのでしょうか。ということで実際にアレクサにいろいろな用語を話しかけてどのような反応になるのか調べてみました。
スピーカーの音をスマホで録音したので雑音が入ってしまっています、申し訳ございません。またヘリウムを吸ってしまい声が高くなっています(嘘)。
物質名の場合
まず、化合物の名前を認識して調べてくれるかを確かめるために「XXXって何?」と聞いてみました。
まずエタノールですが、しっかりと認識されました。
一般的な溶媒(アセトン・メタノール)も問題なく認識されますが、解説文の漢字の読みが誤っているときがあります。
「アセトン」
「メタノール」最後は何言っているかよくわかりません。
次にDMSOを試しました。「ジメチルスルホキシド」と「D・M・S・O」では正しく認識されましたが、
「ジメチルスルホキシド」
「D・M・S・O」
「ディムソー」では、正しく認識されませんでした。自分の発音が悪いのかもしれません。
THFの場合「テトラヒドロフラン」少し嚙んでも認識されましたが、
「T・H・F」は二回やってもダメでした。残念。
元素名も調べてみました。元素記号の下の方も認識されますが、
「オスミウム」
「タングステン」
「フランシウム」
元素であれば認識されましたが、「ホルミウム」や「ジスプロシウム」といったマイナーな希土類元素は認識されませんでした。ジスプロシウムは磁石に使われているほど有名です!
次にハロゲン化物を調べました。フルオロスルホン酸は認識されましたが、
フッ酸は、人名関連の言葉に間違えられることもあります。
フルオロメタンは、認識されませんでした。ゆっくりしゃべりましたが結果は変わりませんでした。
1-ブタノールはうまくいきませんでした。よく考えたらハイフンは読まないので認識されなくて当然かもしれません。
慣用名の場合、有名な化合物であれば認識されますが、Wikipediaがトップに検索されない化合物は認識されませんでした。
「メラトニン」
「スピノシン」「アスパラプチン」アレクサ、ケムステ読んで勉強してね!
「ギンコライド」銀行ではありません。
反応名・化学用語の場合
まずは成功例から
「核磁気共鳴分光法」
「ヘック反応」認識はされますが、有機ハロゲンばけもの(笑)
残念ながら有名な反応や用語でも認識されませんでした。
「スワーン酸化」
「円二色性」間違った引用元のリンクを読み上げるほうが長い・・・
このようにある程度有名な言葉は、正しく認識されて調べた結果が出力されますが、すこしマイナーな化合物や用語になると一般的な用語を当てつけるような挙動がみられました。また、Wikipediaに掲載されているような言葉でも単語が長いと正しく認識されませんでした。専門用語の音声で完璧に理解するにはもう少し技術の発達が必要なのかもしれません。
翻訳機能を試す
アレクサには日本語の単語を英語に翻訳する機能があり例えば、
という風にネイティブな発音で返してくれます。これを化合物でやってみました。長くなってきたので失敗例のみ紹介します。塩化メチレンがえんかみちこいになってしまいました。
注文機能を試す
アレクサにはAmazonに注文できる機能があります。これで試薬や実験器具を注文できないか試してみました。酢酸ナトリウムは問題なく注文できるようです。
[amazonjs asin=”B07BKTPV7Y” locale=”JP” title=”酢酸ナトリウム500g(無水)【食品添加物】”]ビーカーも注文できます。
[amazonjs asin=”B07CZN91N1″ locale=”JP” title=”柴田科学 ビーカー 目安目盛付き 100mL 6-214-03″]しかし、ロータリーエバポレーターは認識されませんでした。
[amazonjs asin=”B06XXJVX7D” locale=”JP” title=”DLABDLAB ロータリーエバポレーター 縦型 /3-7048-01″]最後にAmazonで売っている、とんでもなく高価な器具も注文できるのか試してみました。エアシャワーは、まさかの100万円越えですが淡々と金額を読んでカートに入れてしまいました。
[amazonjs asin=”B07WZBTWLC” locale=”JP” title=”アズワン エアシャワー PSAS-T91PSL-E”]今回は、予め売っている製品の名前をAmazonで調べてからアレクサに問いかけたので、正しい認識が多かったのかもしれません。そのため、AmzonのCMのように漠然と実験中に足りなくなったものを声で注文するのは難しそうです。
アレクサの逆襲
偉そうにアレクサをテストしているが、そういうお前はちゃんと化学を知っているのか?ということでアレクサの逆襲が始まりました。
まじめな話、スマホにアプリをインストールするようにアレクサにもスキルを追加する機能があります。その中に、進研ゼミ高校講座さんが作成した「放課後、わたしと化学1問1答」というスキルがあり、これをインストールすると化学のクイズで遊ぶことができます。あなたは憧れのセンパイが作った「化学クラブ」への入部するために、アレクサが出題するクイズに100問連続正解しなくてはなりません。
[amazonjs asin=”B07BHC1XZJ” locale=”JP” title=”放課後、わたしと化学1問1答”]問題は、センター試験基礎レベルの化学だそうです。2回連続の不正解でチャレンジは終了となります。緊張の第一問は、簡単な二択で助かりました。ほとんどが2択ですが、ときどき自由回答の問題も出題されます。
5問目以降はテンポになれ、第十問まで難なくクリアしました。センパイ、化学好きです(笑)。
第15問で2択問題を間違えました。アレクサは淡々と指摘します。
これなら100問まで余裕だろと思っていたら、まさかの電気親和力を答えられず挑戦終了。ああ、恥ずかしい。
レビューには苦戦しているコメントが寄せられているので、化学を専門にしていても簡単ではないようです。自分のアレクサにはモニタが無いので、聞き取りだけである状況がより難しくしています(言い訳)。モニタがあるデバイスを使うと読み上げるスクリプトが画面に表示されるようです。また、レビューにはアレクサが正しく認識してくれず不正解になったとの声もあり、問題の解答によっては上記で試したように認識が難しいのかもしれません。
まとめ
結果をまとめると、アレクサはまあまあ化学を知っているといったところでしょうか。これは大変くだらない企画でしたが、まじめなことを考えると専門用語の音声認識は、日常会話よりも使われる頻度はずっと少なく需要は高くないと思います。しかし、専門用語が人の理解や行動を妨げている場合もあり、音声認識によってその壁を取り除くことができると予想されます。また、一つの音声認識システムが全ての専門用語をカバーする必要はなく、状況に応じて専門分野を認識し、分野に応じてシステム自体が変われば、誤認識や誤発声も少なくなるかもしれません。