Scribble at 2023-10-30 23:10:39 Last modified: 2023-10-31 15:30:38
恐らくはリンクを辿って大規模なスクレイピングの負荷がかかるのを防ぐためだとは思うし、僕は一定の条件を満たしていないスクレイピングは威力業務妨害にあたると思っているので、コーネル大学が対策を講じることは正当だと思う。でも、最新の1週間ぶんの論文しか閲覧できず、それよりも古い論文をブラウズする方法がどこにも説明されていない、あるいは1週間よりも古い論文の一覧方法そのものが機能として取り除かれたのであれば、これはユーザビリティの重大な欠陥だと思う。1週間ごとにアクセスしないと、どういう論文が出ているのか見逃してしまうなんていうプレプリント・サーバなど、情報の集積システムではなく、単なる PDF を保管する箱でしかない。箱のいちばん上に並んでいる論文の表紙しか眺められませんと言っているようなものだ。
ちなみに、ここ最近はレスポンスが非常に遅くて困っている Edge のサイド・バー(Copilot)で質問してみたら、"Why can't we browse articles more than 1 week at arXiv by Cornel University?" という問いについては、次のように同じような speculation しか返ってこない。
"The arXiv platform, hosted by Cornell University, is designed to provide an open platform where researchers can share and discover new, relevant, and emerging science². However, it seems that the platform's browsing feature is limited to viewing submissions from the past week³. The exact reason for this limitation is not explicitly stated, but it could be due to a variety of factors such as server capacity, data management, or to encourage focus on the most recent research. If you're interested in older articles, you might consider using the search function on arXiv with specific keywords or author names to find them. Alternatively, you could subscribe to the arXiv daily digests for your subject area¹."