NIMS Library x MI2I x SIP-MI 共催オープンセミナー

テーマ「(続々)オープンサイエンスと著作権 - データマイニングからAIへ」

開催日: 2016.11.24 終了


今年の正月に催したセミナー「オープンサイエンスと論文著作権」(2016.1.8)での反響が次企画「オープンサイエンスと著作権 - データ共有」に繋がり、そして今回はいよいよAIの時代へ向かうデータ駆動型研究の流れを受けての第三弾です。

論文には著作物としての著作権が付随し、再利用を促す仕組みとしてCC-BYライセンスが科学の世界に登場して早10年。最近は、学会誌や商業誌に論文をだすと、図表の元データフィルの提出や、補足データの提供も求められるようになり、それらの著作権の履行については投稿・利用規定が分かれる状況があります。またジャーナルが、購読モデルかオープンアクセスモデルかでも、版元の著作権履行の方針が様々であり、著者がオープンアクセスのために負担する出版費用 (Article Processing Charge) の額も異なります。これらオープンサイエンスを取り巻く状況の中で、論文著者と出版者の間に交わす「契約」の重要性を、前回のセミナーで学んだところです。

さて、世界に追随して日本でも実践の段階に入ったオープンサイエンス政策。データ中心の研究が推進される中で、テキスト・データマイニング (TDM) 、そしてAIといった話題まで、材料科学の領域にも新しい考え方として議論が盛んになってきました。こうした状況を背景に、内閣府で行われている議論「次世代知財システム検討委員会」の委員でもおられる福井健策先生を講師に迎え、日本の行方を左右する「次世代の知的財産権の形」についてご講演をいただきます。またエルセビア社からはTDMを研究者に許諾するライセンスの仕組みについて実際例と共にご紹介いただきます。論文データや図表を集めるTDM,そこから生まれる知的財産権にまつわるお話を、本オープンサイエンスセミナーの最終章として括りたいと思います。

皆様、是非お誘い合わせの上、ご参加ください。

なお、これまでと同様に、予めにご質問を受けますので、参加登録の際にお知らせ下さい。

講演1 : オープンサイエンスと著作権 - AIも?

講演概要&講演者ご紹介

  • 福井 健策 弁護士
    骨董通り法律事務所代表パートナー
講演要旨 : 日本がオープンサイエンスを推進することを決めたG7から政府・省庁機関でその具現化のための検討が進む中、論文・データ・TDMに関わる著作権、クリエイティブコモンズなどオープンソース・ライセンスの現状、AIやビッグデータを取り巻く次世代著作権の議論をコンパクトに俯瞰する55分。
 
略歴 : 東京大学法学部卒業後、米国コロンビア大学法学修士課程修了 (Harlan Fiske Stone Scholar賞、セゾン文化財団スカラシップ) 、シンガポール国立大学 (NUS) リサーチスカラー (アジア諸国の放送政策に関する助成研究) を経て、1999年-内藤・清水法律事務所 (現青山総合法律事務所) パートナー、2003年骨董通り法律事務所を設立 (現在、同代表パートナー) 。日本大学芸術学部 客員教授を兼務、国立国会図書館 オンライン資料の補償に関する小委員会 委員長、同 納本制度審議会 会長代理、内閣次世代知財システム検討委員会委員、ほか。



講演2 : Text and Data Mining - Licensing and Practices

講演概要&講演者ご紹介

  • Dr. Anders Karlsson
    Vice President, Strategic Alliances, Global Academic Relations, Elsevier
講演要旨 : With an ever increasing volume of scientific content, using computers to analyze large amounts of scientific material, text, data, images; researchers can discover patterns and gain insights beyond what would be possible by usual ‘human’ reading. This process, known as ‘text and data mining’, abbreviated TDM, or content mining, may lead to discoveries of knowledge hidden to the human eye, thus accelerating innovation. Text and data mining increasingly also relies on technologies such as machine learning and natural language processing (NLP).
 
As a global publisher and information solution company, Elsevier has provided text and data mining support for researchers since 2006. Elsevier, as well as the Science, Technology and Medical Publisher Association - STM, have cross-industry initiatives that support TDM and allow mining of content across publishers.
 
In the presentation, I will first give a brief intro to text and data mining, why it is of increasing interest, then overview Elsevier’s policy for text and data mining and its rationale. I will discuss some of the issues around copyright and licensing that needs to be considered. I will then discuss how we are with the community developing tools for natural language processing (NLP) to support TDM of scientific and medical content, and finally, as inspiration for how we would like to work together with the community, introduce a recent academic partnership with the Humboldt University New Advanced Data & Text (HEADT) Centre.

略歴 : 2012年にアジア太平洋地域のストラテジーアライアンス、グローバルアカデミックリレーションズ部門のヴァイスプレジデントとしてエルゼビアに入社しました。エルゼビアに入社する前は、在日スウェーデン大使館科学技術参事官として日本と韓国の責任者の職責を5年間務めました。スウェーデン王立工科大学量子フォトニクス教授を10年に渡り務めたことに始まり、主な業績として2004年に高度な情報技術コンソーシアムをリードした共同研究が認められ、EUルネ・デカルト研究賞を受賞したことなどが挙げられます。2000年にはスウェーデンの科学技術関係機関(Swedish Foundation for Strategic Research)より、初の将来のリーダー的研究者の20人の中の1人として助成金を受けました。2001から2007年には、スウェーデン研究審議会にて特別研究員も務めました。また、スウェーデン国内だけでなく、NTT基礎研究所客員研究員/講師、アメリカのスタンフォード大学/フルブライト客員研究員、パリのエコール・ポリテクニーク大学、中国の浙江大学、そして大阪大学の顧問としての役職も歴任してきました。彼はスウェーデン王立工科大学 (KTH) の電気工学で修士、物理工学で博士号を取得しています。




ブレイクセッション

今回セミナーへの事前質問

●研究の一手法として、学会や出版社が発行するオンラインジャーナルから、出版論文の本文テキストやデータを機械的にダウンロード (Text and Data Mining, TDM) をする時、「自分の研究用途」とは、どこまでと考えればよいでしょうか。計画当時よりTDM の有用性があり、民間から利用希望があるまでに発展すれば、そこから新しい科学技術に繋がる可能性があります。そうした時 :
 
Q1. 研究テーマに関する複数のジャーナルから、本文(XML, TEXT), 図表(JPEG) をTDM し、自分が管理するサーバに保存、言語処理やデータ抽出、あるいは機械学習のツールやアプリケーションを使って新たな体系として取り出した結果を、自分の成果物として他機関や他国の同僚と共用して良いでしょうか? 
 
Q2. Q1の結果を、有償で提供して良いでしょうか? 
 
Q3. Q1と類似の研究を他の研究者や研究機関が行っている場合に、それらの結果を持ち寄り、皆で使えるようなウェブプラットフォーム化する時、一次出版者 (ジャーナル発行者や著者) に対して許諾を求めたり、ロイヤルティの支払いが必要になるでしょうか? (大量のTDM をすれば、個々の論文やジャーナルの利用権利毎に許諾を求めることが実際的ではないので、実際にはどうすればよいでしょうか?)  
 
Q4. Q3のような情報プラットフォームが多くの人に支持され、持続的にデータを更新するための機械学習やAI の開発費として、若干の使用料を研究者や企業に課金をして支援をして欲しいと考える時、一次出版者に対して何らかの還元の義務を負う可能性はあるでしょうか?私の研究成果としての財産権が守られる範囲は、どこまでなのでしょうか?


●追加質問「データキュレーションに関して」

Q5. 実験データのうち、著作権のない自然科学データと見なせるデータはどのようなデータでしょうか?
また、計算シミュレーションによるデータには著作権が発生するのでしょうか?

Q6. オープンアクセスではない論文に掲載されたグラフから、元の数値データを抜き出して、引用元を示してデータベースに公開した場合、著作権の侵害になりますか?
元のグラフと軸の取り方を同じにした場合のみ、著作権の侵害になりますか?

Q7. 上記の数値データの抜き出しが、2次元マップ型のグラフにも適用可能だと考えた場合、電子顕微鏡像などの2次元画像についても強度と空間内距離を数値化して、自然科学データとして利用することはできるのでしょうか?

Q8. 世界の物性データベース(MatNavi, Materials Project, NoMaD)では、非オープンアクセス論文由来のデータへのアクセスにメンバー登録とログインを必要としています。
この仕組みにより、「不特定多数への公開」と見なされる事態は回避できるのでしょうか?

Q9. 自分の研究機関で得た論文のフルテキストを知り合いの研究者に渡すことを、Elsevierは寛容に認めてくれています。一方、ほかの出版社では規約に書いていないのですが、どのような扱いになっているのでしょうか?
 

参考

NIMS Library Open seminar企画として3回目—オープンサイエンスシリーズ最終章となるにあたって、オープンサイエンス時代に理解しておきたい論文著作権とデータ共有に関し、これまでに受けた質問

第一弾(1/8)オープンサイエンスと著作権 / Open science and copyrights law

Q1. そもそもNC (Non Commercial)という場合の商用とは、例えば研究現場ではどのような場面がありえるか?
 
Q2. NC指定された論文を、研究に従事する企業社員が社内議論に使うことは商用にあたるか?
 
Q3. 教育機関に認められる例外規定は、研究機関には認められないのか? (認められない理由、認められるための条件は?) NIMSは連携大学院等で、大学院生を内外から多くとっており (年150名規模) 、研究機関として教育にも貢献している実状に、教育機関として認められる要素はあるか?
 
Q4. 研究発表スライドに、他人の発表論文から図表を転用することについて、正しい (著作者に同意を求めるべき) に対する許容の範囲は?これをセルフアーカイブし、オープンアクセスする場合にしなければならないことは?
 
Q5. 自分の論文に、他人の論文の図表を転用する場合は発表雑誌に対して転載届けをだすが、その自分の論文をオープンアクセスにする場合に何らかの制限はあるか?
 
Q6. 図書館でのジャーナル購読問題 (予算減、為替変動等) を背景として、ジャーナル本来のpeer to peerのコミュニケーション (論文を通した発見の共有、人類の知) の限界はどこにあるのか?例えば、Twitterに論文提供を求めるタグをつけて、SNSを通して論文を入手するなどの最近のトレンドは、実行ありきなのだろうか?
 
Q7. Fair Useの将来はどのような方向にいきそうか。
 
Q8. 大学教育、産学官の共同研究、多国間の共同研究、国研、それぞれの現場でオープンサイエンスへ向けて、どのように理解をし、どのような準備をしたら良いだろうか?
 

第二弾(3/10)(続)オープンサイエンスと著作権-データ共有/Data Sharing - pros & cons

Q1. 研究データの著作権理解日本の著作権法では、データには著作権がないとされています。研究データの提供 (公開) に際して、著作者・データ作成者として理解しておくべき権利は何でしょうか? 例えば
    作者または作者の所属機関によるデータライセンス提供の観点
    作者のプライバシー保護の観点
などで。
 
Q2. 研究データに関する著作権理解日本の著作権法では、データには著作権がないとされていますが、そこに新たな創作性が加わると、成果全体に対して (例えば物性データベースなど) 著作権が生じると考えてよいでしょうか? YESの場合、
    その「創作性」の範疇に、論文を読み収集したデータ群に対して情報を整理分類し、indexを付加する、検索ができるようにすることが含まれると理解して良いか?
    データベース化する時、データの出典を引用するべきか?
    データベース化する時、データの出典となる論文著者に、収集の許諾 (二次利用) をとるべきか? (CC-BYライセンスで提供された論文の場合は、クレジットを入れれば許諾なしに使ってよいという理解を前提として) 
 
Q3. 引用について
(前回セミナーで、論文引用について現実には著作者に連絡することなく、むしろ引用が論文評価にもなる科学の特殊性においては許諾なく引用する点を学びましたが) データの引用についてはどうでしょうか?
 
Q4. 知的財産権
知的財産権 (intellectual property rights)という観点で、データ著作権について、知的財産と論文著作権 (財産権) という対比でどう理解すればよいでしょうか?

セミナー案内

イベント・セミナーデータ

イベント・セミナー名
NIMS Library x MI2I x SIP-MI 共催オープンセミナー
テーマ「(続々)オープンサイエンスと著作権 - データマイニングからAIへ」
会場
NIMS 千現地区 第一会議室
開催日: 時間
2016.11.24
15:00-17:00
参加料
参加費不要、事前登録必須
開催プログラム
司 会 : 谷藤 幹子 科学情報プラットフォーム長
式次第 :
  • 15:00 はじめに 源 聡 構造材料研究拠点 SIP-MIラボ 統合システムチーム 副チーム長
  • 15:05-16:00 講演1
  • 16:00-16:30 講演2
  • 16:30-16:50 ブレイクセッション
  • 16:50 おわりに 伊藤 聡 MI2Iプログラムマネジャー
言語
講演2は英語、他は日本語 (The second lecture is in English)
主催
物質・材料研究機構 技術開発・共用部門科学情報プラットフォーム
情報統合型物質・材料研究拠点MI2I
構造材料研究拠点SIP-MIラボ

お問い合わせ・申し込み

物質・材料研究機構 科学情報プラットフォーム
E-Mail: kagaku=ml.nims.go.jp([ = ] を [ @ ] にしてください)
2024.11
Sun Mon Tue Wed Thu Fri Sat
1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30