7月末、The GuardianがSiriに録音されたごく一部の会話が下請け業者に渡され、人間が文字起こししてSiriの品質向上に役立てる「グレーディング」に用いられていると報道。アップルはこれを事実と認めて、徹底的な見直しを行っているとともにグレーディングを世界的に中止したとして、将来のソフトウェアアップデートではユーザーが録音に同意するかどうかを選択できるようになると述べていました。
その仕事を担当していたアイルランドの下請け業者は契約が打ち切られ、約300人以上が解雇されたとも伝えられています。
アップルは28日(米現地時間)、正式に謝罪を表明。ニュースリリースでは「レビューの結果、わが社は自分たちの高い理想に完全に応えていないことに気づきました。そのため、謝罪します」と述べられています。
謝罪リリースと合わせて公表されたサポート文書「Siriのプライバシーとグレーディング」では、一般的な質問に対するFAQも用意されています。興味深いのは、設定で許可していないユーザーの音声録音は保持されないものの、「コンピューターで生成されたSiriインタラクション(やり取り)の文字起こしは引き続きレビューすると明かされている点です(以下は該当箇所の筆者訳)。
Q.Siriを無効にするためにオーディオ録音とトランスクリプトを保持しない唯一の方法はありますか?
A.デフォルトでは、Appleは2019年秋のソフトウェアリリースから、Siriリクエストの音声を保持しなくなります。コンピュータが生成した音声リクエストの文字起こしは、Siriの改善に使用される場合があります。これらの文字起こしは、最大6か月間、Apple IDではなくランダムな識別子に関連付けられます。Siriオーディオ録音の文字起こしを保持したくない場合は、設定でSiriとディクテーション(音声入力)を無効にできます。
つまり、完全にSiriとのやり取りをいかなる形であれ記録されたくなければ、Siriを無効化するしかないわけです。
また設定を許可したユーザーに関しても、レビュープロセスを更新し、Siriが間違って起動されたために生じたと判断された音声録音が人間のレビュアーに聴かれる事態を制限したとのこと。グレーディングを再開したさいには、間違って起動したと判断された記録は削除するように作業するとの方針が語られています。
さらに人間のレビュアーが聴けるデータもできる限り少なく制限したと述べられています(以下、該当箇所の筆者訳)。
Q.データレビュアーがアクセスできるデータの量を最小限に抑えていたというのは、どういう意味ですか?その上で人間のレビュアーが聴く録音とは、具体的には何でしょうか?
A.人間が関わるグレーディングプロセスを変更して、レビュアーがアクセスできる量をさらに最小限に抑え、作業を効果的に行うために必要なデータのみが閲覧できるようにします。たとえば、ホームアプリで設定したデバイスと部屋の名前は、評価対象のリクエストにホーム内のデバイスの制御が含まれる場合にのみ、レビュー担当者がアクセスできます。
つまり「部屋」が制御するデバイスと関わる場合のみ人間が聴くことができ、それ以外の「部屋」は聴けないということでしょう。
要はユーザーの生音声や間違ったトリガー(Hey Siriの聞き間違え)は聴かないようにするが、正当に受け付けられたSiriとの文字起こしは同意があろうとなかろうと人間のレビュアーが読むということ。なんとも率直な回答ですが、音声アシスタントの品質向上のためにはこれがギリギリの譲歩といったところでしょう。
依然としてSiriはGoogleアシスタントに理解度と正答率で劣ってはいるものの、着実に進化の跡が見られます。とはいえ、アップルはプライバシー保護を他社との差別化として打ち出している以上、ユーザーから同意を得るポリシーに関しては、その徹底が望まれそうです。
クレジットソースリンク