ウィスコンシン州の研究者は、PVC パイプの少しの助けを借りて、いくつかの音声識別システムをだます
2024-01-08 09:00
しまー アーメド はマディソン大学の博士課程の学生です。彼女は、自動話者識別装置を無効にするために、音声の共鳴、つまり特定の周波数の振動を変更できるかどうかを調査しました。
人の声をパスコードとして使用するコンピュータ システムをだますことは可能ですか? ウィスコンシン州の技術者の中には、答えはイエスであり、金物店で買えるプラスチックのパイプを部分的に使って実現したと言う人もいる。
一部のオンライン バンキング システムでは、自動話者識別 (より簡単に言うと、口座名義人の声) をパスコードとして使用します。ウィスコンシン州マディソン校電気・コンピュータ工学教授のカセム・ファワズ氏も、りんご iPhone ユーザーは所有者にのみ応答する仮想アシスタント シリ に精通している可能性が高いと述べています。
"シリ があなたにのみ応答するのは、シリ が話者識別と呼ばれるこの技術を採用しているためです。したがって、彼らは指紋に似たある種の声紋を取得し、それがあなたからのものなのか、それとも他の人からのものなのかを確認することができます。これが、シリ がユーザーまたは携帯電話の所有者が話しかけていることを確認する方法です。"ファワズ氏は言う。
しかし、ファワズと2人のUWマディソン博士号は、学生たちは、デジタル セキュリティを向上させるための複数の大学の取り組みに参加しています。そこで、彼らはコンピュータ システムをだます方法を研究してきました。彼らや他の研究者たちは、人間の声を複製し、コンピューターにその人のように話すようにさせることにすでに取り組んでいます。
最近になってファワズ氏は、技術者たちがデジタルから逆戻りしてアナログに移行すれば、多くの話者識別システムを騙すことができることに気づいたと述べた。
"こうして私たちは、他人になりすますことができる、デジタル電子機器を一切持たない、ある種のアナログデバイスを設計するというアイデアにたどり着きました。"ファワズ氏は言う。
博士号 学生のシマア・アーメッドさんは、最初は多くのペーパータオルロールに入っているボール紙の筒を通して、有名人の真似をして話してみた、と語った。
"そしてそれはうまくいきました。このキッチンペーパータオルの筒に有名人の声を通したところ、その有名人の予測が変わりました。"アーメドさんは言う。
結局、ファワズさんはプラスチックを買った塩ビパイプ金物店の配管部品売り場から入手し、チームはそれを使い始めました。
ウィスコンシン大学マディソン校工学部電気・コンピュータ工学科の助教授カッサム・ファワズ氏、2022年2月15日、スタジオポートレートで撮影。ファワズ氏は2022年のDistinguished Teachingの12人の受賞者の1人賞(DTA)。(写真提供: アルテア ドツール / ウィスコンシン州 – マディソン)
ファワズ氏は、真空管には欠点があることに気づいたと言う。
"通常の配管チューブは寸法が決まっていますよね?カットすることで長さをコントロールできます。しかし、直径を制御することはできません。一部の実験では、エース ハードウェア では見つけられない特別な直径のチューブが必要でした。したがって、これらのチューブを製造するために必要なことは、チューブを製造する最も簡単な方法は、3D プリントすることです。"ファワズ氏は言う。
チームは当時学部生で、現在は博士号を取得した博士に目を向けました。いくつかのチューブを 3D プリントした学生のヤシュ ワニ。ワニさんは、この研究によって学問への焦点が変わったと語る。
"正直に言うと、こうして博士号を取得することができたのはとてもクールでした。それを続けるのは十分にクールだった、"彼は言います。
研究者らは、ほぼすべての声の共鳴、つまり音の強さと質を変換して別の声を模倣するために必要なパイプの寸法を割り出すアルゴリズム、つまり厳密な指示を開発した。
ある録音では、アーメッドが従来の音声データセットを読み上げ、女優のリサ・クドローに少し似ているように聞こえました。&注意;友達。
"岩の上には何もなかったのですが、"読書に行きました。アーメッドさんは、テレビシリーズに出演している女優ケリー・ライリーの真似にも挑戦した&注意;イエローストーン。"「分かりません」とフィリップは答えました。"アーメド氏は録音でこう語った。
それらは正確に模造されたものではありませんでした。しかし、音声認証システムのデジタル攻撃フィルターを通過して騙すには十分でした。実験では他の学生の音声も使用し、ウィスコンシン大学マディソン校のエンジニアは、91 の音声のテストで 60% の確率でセキュリティ システムを欺いたと報告しています。
論文を執筆し、アーメッド氏が今月カリフォルニアで開催されるセキュリティシンポジウムで調査結果を発表するには十分だ。
"人々は、どのようにしてチューブのような、しかしより複雑な、あらゆる人になりすますことができる装置を作ることができるのかについて興味を持っていました。"アーメドさんは言う。
ファワズ氏は、話者識別システムのメーカーはすべて、りんご、グーグル、IBM、マイクロソフト など、自社のテクノロジーのさまざまな欠点を認識しており、それらを修正しようとしていると述べています。
ワシントン大学の研究への資金提供者には、国立科学財団と国防総省の大きな研究部門である DARPA が含まれます。