犬とChatできるかも知れない

 

ChatGPTが音声を認識し、まるで実在の人間と会話しているかのようなAIの「振る舞い」には、少なからず衝撃を受けたものでした。

けれども、少し冷静になってみれば、こういう「出来事」はすでにSF小説のなかで青写真として描かれていますね。

例えば、P.ホーガンの「星を継ぐもの」に登場したゾラック(シャピアロン号のコンピューター)は、人類とガニメアンとの邂逅で、異種間の橋渡し役として大活躍していました。

異種間との交流にAIに手伝ってもらう。そういう発想は、人間の得意とするところなのかも知れません。

今回紹介する研究テーマを見て、すぐにゾラックを思い出したのでした。

それは「犬の鳴き声をAIに解読してもらえないか」です。

ミシガン大学とメキシコの国立天体物理光学電子工学研究所の研究者たちが協力し、この新しい可能性を探求しています。

犬の吠え声、唸り声、鳴き声が何を意味しているのか、AIを使って解読しようという試みです。

この研究では、AIが犬の鳴き声を分析し、遊んでいるときの吠え声と攻撃的な唸り声を区別できるかどうかを調べました。

また、鳴き声から犬の年齢、品種、性別を特定することも試みました。

研究チームは、メキシコのテピクとプエブラで74匹の犬から鳴き声を収集しました。

これらの犬は主にチワワ、フレンチプードル、シュナウザーで、5か月から84か月と幅広い年齢です。

録音は犬たちが普段過ごしている家庭環境で行われ、自然な鳴き声を捉えるようにしました。

例えば、見知らぬ人が現れたり、遊んだり、飼い主が愛情を示したり、さらには飼い主が攻撃されるような状況をシミュレートしました。

これらの鳴き声はソニーのハンディカムで録音され、その音声データだけが分析に使用されました。

録音された音声は0.3秒から5秒の短いクリップに分割され、それぞれの状況に基づいて手作業で注釈が付けられました。

注釈は「非常に攻撃的な吠え声」「見知らぬ人に対する普通の吠え声」「飼い主への攻撃に対する吠え声」「遊びの中での吠え声」など、14種類に分類されました。

研究チームは、Wav2Vec2というAIモデルを使って、これらの鳴き声を分析しました。

このモデルは元々人間の音声認識のために開発されたもので、犬の鳴き声にも応用できるように調整されました。

その結果、このモデルは個々の犬を識別したり、品種を特定したりする能力に優れていることがわかりました。

この研究は、動物のコミュニケーションを解読するために、人間の音声処理技術を利用する新しい道を開いたと言えます。

動物の鳴き声に含まれる複雑なパターンを理解することで、動物福祉の向上や人と動物の関係強化(!)に役立つかもしれません。

しかし、この研究にはいくつかの制限があります。

対象となった犬種が限られているため、将来的にはもっと多様な犬種や他の動物種にも研究を広げる必要があります。

私の個人的な願いとしては、イルカもぜひ候補にあげてほしいです。

地球上の多種多様な動物種との会話が可能になれば、遠い未来には、本当の「地球会議」を開催できるかも知れませんね。

 

元論文:

Perez-Espinosa, Perez-Espinosa, Humberto, et al. Towards Dog Bark Decoding: Leveraging Human Speech Processing for Automated Bark ClassificationProceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024) May, 2024. https://aclanthology.org/2024.lrec-main.1432