第53章 多肉 重生2008:从助教逆袭为院士
搜寻引擎部门,无疑是百度的核心部门之一。
但吴辰更想和知识產品部合作。
因为他们旗下百度知道、百度百科和百度文库的数据更適合吴辰使用。
毕竟数据量大固然好,但数据质量也很重要。
让大模型学习的过程,就是把问题和正確答案告诉它,这就要用到好的数据。
举个例子:
好数据:1+1=2
坏数据:1+1=3
这一步是要人来完成好和坏的鑑定,即俗称的数据標註。
当人工智慧大模型学习完成后,如果有人问1+1等於几,那么它就知道是2,因为人类已经提前告诉它答案了。
但遗憾的是,网际网路上的绝大多数数据,都是坏数据。
比如0.8乘以0.5,还有不少人回答结果等於0.04。
人工智慧要是整天学习这些玩意,那不成人工智障才怪。
所以对大量的数据,还得有人来纠正它。
比如问人工智慧大模型,0.8乘以0.5是多少。
它如果回答0.04,那就要人类来校正它正確结果是0.4。
这个专业术语叫做:监督学习。
而百度知识產品部的数据,大多数就是这种正確的数据,拿来直接做监督学习的训练素材非常合適。
所以如果有机会,吴辰还是想爭取一下和他们的合作。
---------------
周五上班时,吴辰在下午下课后去找了一趟许建平。
除了签订和学校的合同外,还顺便拿到了自己的教授聘书。
当然,这只是学校的绿色通道走了快速流程。
要等到省教育厅和教育部备案入库,估计还得1个月左右的时间。
但无论如何,从此以后,他在对外交流时都可以称自己是吴教授了。
拍照合影时,吴辰笑的很开心。
以后只要他不犯原则性错误,那也算是有真正的铁饭碗了。
许建平也很开心。
这几天他也找人研究了吴辰的成果,给出的意见都是他捡到宝了。
要是继续保持下去,一个学科带头人是不会有问题的。
所以许建平已经下定决心,要大力培养一番吴辰,让小和山工业大学在即將到来的2011评审中,再拿出一项重磅成果。
所以这也算是两人的双向奔赴了。
“吴教授,接下来你准备做哪方面的研究啊,要学校怎么配合?”
许建平想听听吴辰的想法,毕竟他是计算机的外行。
“校长,我下周六的时候打算去京大办个讲座,顺便联繫一下百度那边谈谈数据获取的事,如果没问题,那咱们这边可以成立一个联合实验室,做一下人工智慧的深入研究。”
吴辰也没隱瞒。
许建平疑惑道:“为什么要去百度,咱们这边离阿里更近,他们的数据也很多嘛。”
这个时候的阿里虽然还没有后来那样如日中天,但品牌效应和规模也已经起来了,而且总部也离学校不远。
“他们的数据暂时还太单一,不过如果能合作也是可以的。”
吴辰没把话说的太死。
毕竟在杭城做网际网路,那阿里就是一个绕不开的话题。
而杭城的小微科技企业一般也就是两个出路:
要么做强做大,被阿里入股。
要么做大做强,被阿里收购。
许建平倒是没想那么多,对他来说能达成一项完美的校企合作才是最重要的。
所以他语重心长的叮嘱道:“小吴啊,做理论研究我也不多说什么了,但要是做应用转换,还是要注意派系问题的。”
网际网路行业的派系划分很明显,最终总会和bat沾边,即百度、阿里和腾讯。
属於哪个派系,也和地域特徵十分相关,比如粤省就是小马哥的天下,浙省就是马芸的金矿。
吴辰点头表示受教。
当然他知道后来百度没落了,有个新的b顶替了上来,即字节跳动(bit dance)。
所以自己也算是提前十年吃上百度的遗產了。
本章未完,点击下一页继续阅读。(1 / 2)