Scribble at 2024-06-25 08:07:40 Last modified: unmodified

添付画像

AI Generated Content and Academic Journals

スイスの分析哲学系のジャーナルである Dialectica の編集方針について取り上げられている。AI で生成されたイカサマ論文かどうかの判定をテーマにして、そのツールの信頼性、それから信頼性を引き上げるために分散モデルをトレーニングする手法の懸念について書かれている。当然だが、そろそろ他のジャーナルでも「剽窃や盗用はやめましょう」といった小学校の学級委員や規律委員みたいなメッセージを掲げるだけでは不十分であろう。

というか、ジャーナルの編集委員会で独自の判定基準として分散モデルを用意するのか(そんな予算はないと思うねぇ。LLM のモデルを最初からトレーニングする予算規模なんて、どこも公表してないんだけど、AWS とか借りるとして何億円だろう)、それとも分散モデルを作るなんて巨大なリソースを費やすほどはなくても、特定の分野に絞って判定するような解析データを過去の論文からトレーニングして採用するのか(オンライン・サービスを使うのはよくないと Dialectica の副編集長は書いているから、Transformer のような解析ツールはともかく、データの運用については自前のトレーニング環境を使うことになるかもしれない)。それに、どういう解析をしたにせよ、判定基準をどこにおくかは編集者が決めないといけないことだ。その判定すら AI に任せるなんてことは、まだできないだろう。

さてさて、このほど国内でも生成 AI 関連でカンファレンスを開催するようだし、この国には元エンジニアを謳ってる分析系の物書きが何人かいるようだから、彼らの手を借りるのか、それとも東大暗記小僧の諸君がこれから機械学習のお勉強を始めるのかはしらんけど、お手並み拝見といったところか。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る


※ 以下の SNS 共有ボタンは JavaScript を使っておらず、ボタンを押すまでは SNS サイトと全く通信しません。

Twitter Facebook