科学网—让AI帮你“读书写书”

  • 时间:
  • 浏览:3
  • 来源:福建农林大学教务管理系统_潍坊学院教务处_哈尔滨工程大学教务处
阅读模式 让AI帮你“读书写书” ——访施普林格·自然全球图书业务总裁汤恩平

汤恩平

■本报记者 冯丽妃

高尔基说,书籍是人类进步的阶梯;莎士比亚说,书籍是人类知识的总结;列夫 托尔斯泰说,理想的书籍是智慧的钥匙 有没有想过,有一天你能根据阅读需要让一本书的内容随意 加长或缩短 ?或者,如果你是一位作者,有没有想过让机器替你干活,助你写得更快、更好?

在Niels Peter Thomas(汤恩平)看来, 人工智能(AI)时代,一切皆有可能 。近日,在其来华访问之际,《中国科学报》采访了这位施普林格 自然集团全球图书业务总裁。

《中国科学报》: 今年4月,施普林格 自然出版了第一本由机器生成的书籍《锂离子电池》。请谈谈这本书的出版背景和读者反馈。

汤恩平: 实际上,这是地球上第一本AI学术书籍,对我们来说也是第一次。它是大约两年前开始的一个项目。我和一个同事知道很多初创公司声称可以通过深度学习等技术处理自然语言,这让我们有些担心。如果某家科技巨头开始用AI出版图书,大概不太会关心版权、学术严谨性和同行评价,而只关心花哨的技术。我们只有比他们更快,才有机会解决这些出版方面的问题,所以我们秘而不宣地做了这件事。

我们和德国法兰克福大学的研究人员合作,开发了一款叫作 Beta Writer 的先进算法,从施普林格 自然的内容平台上挑选、使用和处理锂电池领域的相关出版内容。一年半后,我们做到了。这本书只有序言是由人写的,目录以后的其他部分都是纯机器写的,我们没有改变一个字母和符号,所以书里有些句子可能有语法上的错误。但我们认为向世界展示这个算法能做什么更重要,所以整个过程是严格和透明的。

《中国科学报》: AI书籍涉及的版权问题怎么办?如何避免AI 抄袭 ?

汤恩平: 这本书是免费的,因此不涉及版权问题。版权非常复杂,各国的情况不尽相同。我们已找到了一种展示和出版的方法来应对这个问题。其实更难的是书里引用了一些内容,我们会像对待任何其他图书一样确保其学术严谨性,所以你可以看到各种参考文献、数字对象识别号以及很多脚注。我们确保了这本书所引用的作者原始观点都已注明出处。

因此这本书里没有抄袭,但要确保算法不抄袭非常复杂。我们需要让算法阅读所有其他材料,然后得出新的结论,并以某种新的形式呈现。这本书当然是基于它读过的成千上万篇文章完成的,这就像研究者在写新书时会阅读大量材料,然后得出自己的结论,人类写的书籍总是基于其他人的作品,机器也是一样。但要教会机器遵守所有规则而不侵犯版权,这非常困难。但我认为我们已经成功地把它作为一个试验展示给科学界,就此进行讨论。目前还没有作者抱怨说他们不想在机器写的书籍中被提及。

《中国科学报》: 你如何看待AI书籍的前景?

汤恩平: 第一本AI书籍出版后,目前我们正在其他几个学科领域进行尝试。但我们没有计划在1000个主题上制作人工书籍,尽管这很容易做到,写这样一本书只需要半个小时。尽管我们花了两年时间创建算法,一旦有了算法,就可以把它用在其他各种主题上。

我确信AI会为图书出版带来有益贡献。当人类作者要写一本书时,我们可生成一些文稿供其使用,帮助人类作者写得更快、更好。想象一下,如果你要写一本书,就必须阅读大量的材料,这样才能总结当前的情况并找出自己研究的重点,这实际上可以通过算法来实现。算法能帮你找到书中可引用的内容,总结已经出版的内容。未来,技术能为所有作者带来帮助,让他们能更快地写书,由此促进科研过程。

今后它还可以帮助我们在一本书的每个章节前创建一个概述,方便人们快速地浏览,而不再需要作者去完成。有一天,对于每一本书,你只需说出所需阅读时间,就会得到一个精确匹配的版本,算法可以缩短或加长它。或者,有读者想了解一本书,但对化学等知识知之甚少,我们可以用其他内容让一个句子变长以做出解释。所以,虽然它最初是为研究人员设计的,但也会让读者更轻松地阅读一本书。

《中国科学报》: 这本AI书同时也是一本开放获取(OA)的书籍。请问施普林格 自然目前的OA图书出版现状和趋势如何?与OA期刊有什么不同?

汤恩平: 我们第一本真正的OA书籍是在2010年出版的,现在总数近1000本。施普林格 自然每年出版新书约1.3万册,OA图书目前比例仍较低,但重要的是其增长率非常高,目前年增长率是40%。实际上,我们会首先决定是否出版一本书,然后再讨论它的商业模式,其中质量是唯一的决定因素。今年OA图书的增长率还可能会更高。

这些OA图书涵盖了不同的学科领域。一个有趣和明显的趋势是,OA期刊,我们看到的更多是生命科学和技术领域的;而OA书籍,则最多的是人文、社科领域,当然也有自然科学、工程、计算机、医学等学科。

OA图书与OA期刊的最大差异其实也就是图书与期刊之间的差异。学术期刊某种程度上更同质化,而学术图书更多样化,它有各种完全不同的形式,如教科书、专著、会议论文集、手册等。OA图书并没有绿色开放路径。在互联网上免费上传PDF格式的手稿并不是开放获取书籍,真正的OA书籍出版涉及上百个环节,是一个非常复杂的过程,需要元数据、质量控制、图书管理员的标记记录等等。

《中国科学报》: OA图书的业务模式是怎样的,由谁来支付出版费用?

汤恩平: OA图书与OA期刊类似,需要收取文章处理费用(APC),这通常很少由作者来支付,多数情况下由科研资助机构或作者所在大学从研究经费中支出,偶尔我们也会协助作者去寻找资助机构。

需要说明的是,对于我们出版的非OA形式的传统书籍来说,作者不需要支付出版费用。相反,作者会得到版税,分享图书销售所得。之所以这样做是因为我们相信,如果一本书的质量好,我们就能通过国际市场销售,而不是从作者那里获得收入。这就是为什么我们只注重质量。

《中国科学报》: 你在选择一本好书时有什么标准?

汤恩平: 因为书籍类型是多样的,这意味着选择好书的标准会有所不同。拿专业书籍或专著来说,我们接受一本书的唯一原因是质量,但问题是质量作为一个概念并不容易衡量和定义。我们从图书出版史可以看到,有些书开始被忽视,10年后才明白它实际上是一种里程碑式的成就。比如,日裔美籍物理学家中村修二曾在我们这里出版了一本书,并由此获得了诺贝尔物理学奖。这本书的使用和引用量都很少,它是如此高深,我们也不知道出版后有多少人能理解它,所以决策起来不轻松。我们要考虑 它是不是没有错误?是不是可靠的科学研究?有什么新的贡献吗? 这些是我们决策的标准。

《中国科学报》: 施普林格 自然出版的由中国作者撰写的图书有什么样的趋势?

汤恩平: 增长很快,需求也很大。我从2011年到2014年在北京工作过3年,当时,我们办公室人员还不到现在的1/3,近10年间我们增加了很多本地员工。中国作者数量增长也很快,可谓 爆炸式 增长。当年我们出版来自中国作者的图书不足100本,如今每年已达800本左右。我们多数作者都曾以中文出版过图书或发表过论文,但我认为跨国的科研和学术交流非常重要,这有益于世界,也有益于中国研究人员,因为他们可以通过自己的书与国际读者进行更广泛的讨论。

目前,中国的研究在国际出版界并未得到充分展示。其中一个原因是语言障碍,另外一个原因是中国非常大,自己有较好的内部对话交流。若以欧洲或亚洲的小国家为例,有些领域只有很少的研究人员,他们必须走向国际,因为在本国没有人可以相互讨论。中国有这么多研究人员,有自己的学术会议,本土科研交流也很强,所以对他们来说压力没那么大。但达到一定程度,就有必要与国际同行进行交流,这会非常有益。

《中国科学报》 (2019-09-30 第3版 国际) 打印 发E-mail给:

猜你喜欢