问:我的一个朋友,已经毕业了,发现硕士论文里数据大片错误,但是当时答辩时也没被发现指出来
- 答:算数据造假,但是已经毕业,应该不至于被取消学位。
硕士论文算错也就是数据造假。如果论文数据的确存在造假行为,那就存在被人发现的可能,一旦被查,将会受到相应的处罚。据统计,数据造假发生最多的领域,第一是医学, 其次是。硕士论文一般是由学校保存,只有优秀的论文才能被等 数据库收录。
但是在论文答辩之前要经过审核的,还是要注意一些为好。 对论文的认真程度,要看你的答辩组的老师态度了,还有硕士论文在毕业之后,还会经历一次教育部的抽查, 如果到那时被发现出了问题,就比较麻烦了。所以建议你如果数据可以得到真实的,就避免使用虚假数据。
论文春拿数据重要性:
虽然审稿专家没有发现,但是并不代表论文发表出去后,别人发现不了。要知道论文发表出去,面向的是与你方向相同的人员,肯定会有不少同行业的人员阅读你的论文,若是发现错误,那么会质疑你的论文水平,也会怀疑杂志社及审稿专家的水平,对你今后在行业的发展并没有好处。
所以,一旦发现错误之后,就要及时联系杂志社或是审稿专家修改。尤其是医学方面的作者来说,任何一个小数的错误,可能都会影响整个研究实验,甚至会造成连锁反应。就拿药学论文来说,因为一个小数原则,可能导致某一项药品成分增加或是减少, 起到相反的作用,那么后果是非常严重的。
而对于一件机械零件咐森友的设计而言,可能因为一厘一毫的差别, 而导致一批零件无法衡槐投入使用。所以发现错误后要及时修改,这既是对自己,也是对他人负责的表现。 - 答:呵呵~~~没事,查到也是学校的责任,学校会帮你的,没事放心吧!
问:硕士论文不造假的有多少
- 答:有很多,造假是不可取得。
硕士研究生毕业论文数据备迟造假不可取,后果很严重,学术红线不能踏。
比如:
1、这个学生为了毕业论文不惜数据造假!同学说他们学校的一个硕士生拆指,毕业论文的数据是造假的,以为老师不会查。因为数据好得太明显了,老师跟他要源代码进行复核,才发现一切都是假的。
2、北京某211的同学跟我说,他隔壁实验室一硕士生在做自然语言处理中机器翻译相关的毕业课题。这硕士生年前还没有什么进展,年后突然说做好了,而且数据非常漂亮,甚至超过了目前国际顶会上最优的性能,写完毕业论文给老师审核。老师看到这个理想的结果之后,估仿御李计感觉结果很好,可以试着拓展一下投稿人工智能的国际顶会。就让他把代码给博士生去复现一下,然后再拓展一下创新点写英文论文,想投稿最近的自然语言处理国际顶会(EMNLP2021),当然是给博士和硕士共同第一作者。
问:研究生论文数据造假会被发现吗
- 答:研究生论文数据造假会被发现如下:
造假被查出来的大都是生物,材料之类的领域,然而计算机(特指深度学习)才是重灾区,造假容易复现困难随机性强,别说二流论文,顶会论文都没有参考价值。所以除了廉价劳动力够多的大研究室,其他人论文的数量基本取决于不要脸的程度。这也是我再也不想碰ML领域会议的原因。
比如组合优化的性能曲线,所有人都知道是个指数曲线,你搞个新的剪枝条件,水一点咱不求正确解,毕竟大部分应用下并不需要正确解,切掉1%的解换来50%的速度是很合理的思想。什么性能改进不够大?5次实验最好的跟最坏的比啊,还不行用C+SIMD写的跟Java的比啊,再不行竖搭说实话你随便编个数也没人看得出来,毕竟理论上行得通,行不通那是他程序写的不好。
要说上面想法毕竟真的,顶多偷懒不想做实验,到了ML领域之后那就是明明白白的造假了。数据集精选到位,想法再烂几百个实验里只要能挑出一个能看的,那就是顶会苗子——normalization + adaptive learning rate + manifold constraint审稿人怎么知道哪个项work?
再进一步,古典ML还要你写程序做实验,到了DL里这些全都可以省了,完全可以画图编数据发顶会一步到位。毕竟就是个人肉Architecture Search,随便找个domain画个图,编个比SOTA高一点的精度,一篇论文就诞生了。需要公开数据集和代码?某国际大厂研究院实习生发的顶会论文也带代码,
最近有些研究都开始明目张碧纤乱胆的把validation dataset的distribution当制约条件,甚至直接sample数据进train loop,好家伙演都不演骑头上侮辱人智商呢是不?人家都把造假上升为novel approach了,悔档就别提被发现了,那是伟大的研究懂不懂。