扣肉:我想问一件事。某个平台收了我们学生的论文纸本,按理说是扫描成图像,没法用于文字查重吧。难道还要进行OCR?而且普通期刊,如果不把文字给它,也恐怕很难用于查重。图片是没法用于查重的。boson:你以为数据库只扫描图像?扣肉:他们要进行OCR?boson:你没从CAJ文件中复制过文本吗?扣肉:我一直以为得是版权单位给他文字格式的PDF才行。图片是不可能的。期刊排版,很多是分栏的,进行OCR后,语义可能被打断。boson:不一定是OCR,以前可能用过OCR。沈师王*海:[学位论文]收走时,直接带word文档的。可不只是纸本。扣肉:我们的学生不给数据库平台。源文件不会给的。因为他们手里都不一定有。沈师王*海:那可能你们不给,很多学校都给。而且,连本科生论文,他们都要。扣肉:我们的学生中间改过很多次,论文的最终版可能是在复印社。boson:给不给你不一定知道。商业数据库平台又不是从图书馆拿。扣肉:可能。因为我校研究生院的工作状态向来是混乱的。还有,我们的学报,被某平台买断。我们自己要看电子版,也还是要花钱订。cpulib:学位论文确实需要有高校图书馆牵头建一个共享平台,数据库商拿去又高价卖出来。叮咚:很多时候,某网都是从研究生院拿学位论文,拿免费查重的次数做交换。扣肉:技术上来说,如果有的期刊独家授权给万方,那么该网是查不出来的。cpulib:反正我们学校不允许。一篇都不能给。
以下格式等价,请按需引用或修改后使用:
[1]圕人堂QQ群知识库.数据库平台所收录的学位论文文本在查重系统中的作用[EB/OL].(2018-05-18)[2024-11-24].http://tuan.pub/server/detail.php?id=3802.
[2]扣肉,boson,沈师王*海,等.数据库平台所收录的学位论文文本在查重系统中的作用[DB/OL].圕人堂周讯,2018(210):4.
[3]扣肉,boson,沈师王*海,等.数据库平台所收录的学位论文文本在查重系统中的作用[DB/OL].(2018-05-18)[2024-11-24].http://tuan.pub/server/detail.php?id=3802.