Scribble at 2024-05-31 19:38:37 Last modified: unmodified
また、95%の高精度と言っても完璧ではありません。予測が正確だとしても、20回に1回は間違った予測をすることになります。ここでの問題点は、この予測サービスを利用するカップルが増えれば増えるほど、「AIが離婚すると言ったから」と離婚する確率が高まり、AIの予測データを精査することなく「正答率」が上がっていくという点。ホフウェバー氏は「AIの予測は、人為的、もしくは自己成就的性質によって、精度を上げる可能性があります」と表現しています。
要するに、AI の予測が逆にアナウンス効果となってしまうことに問題があるという話なんだけど、この議論って何か違和感があるんだよね。
たとえば、正確な予測のためにはトレーニングのデータとして結婚した人々の相当に詳細なデータが必要だよね。「これまでの記録では、結婚した人々の何割が何年以内に離婚しました」なんていう、高校レベルの統計の話をしているわけではないからだ。すると、離婚した理由は分からないまでも、少なくとも予測の対象として該当するだけの、特異な他の条件に置かれていないと推定できるパーティションに入っていなきゃいけないわけだ。いまさら当サイトにアクセスしているような皆さんにシンプソンのパラドクスの話などしてもしょうがないだろう。で、そういう特異な条件に置かれていないと言いうるためには、やはり大量の属性が必要なわけであって、これは先日の話題として Google の API 文書が公になったという事実によって、SEO 業界の予想通り数千の属性を組み合わせていたことが分かったんだよね。つまりランキングのスコアを計算するのに数千の属性が必要だというわけで、それらを集めて評価して初めて個々のサイトは検索の結果にしかじかの順位で掲載するに値するかどうかが決まる。これも、結局は多くの属性をもつ夫婦が一定の期間を経て離婚するような人々なのかどうかという評価の話と同じなんだよね。
ということは、簡単なことだけど大量の属性を僕らは開示しないといけないわけだよ。これについて何の疑問もないんですかというのが僕の冒頭の「違和感」なんだよね。もちろん、これは僕が企業で個人情報保護管理者(chief privacy officer)を拝命しているという職能から言っても当然の疑問だ。じゃあ、仮に世界中の男女がそれらの属性データを例外なく提出するか強制的に測定されるとしてだね(たぶん、その中にはチンコの長さとか膣の内径とかも入ってるわけだよ。哲学のサイトで書くようなことじゃないだろうけどさ)、それで最も相性が良いと判定されたからといって、結婚するか? あるいはできるのかね。