🧠✨ “宸”思漫谈: 大语言模型对CS的学习方式真的具有革命性的影响力吗?

📌 在我的印象中,人工智能爆发那一年,我还是在上高中,当时Chat-GPT4横空出世,同年年底OpenAI又推出了视频推理模型Sora,我当然也第一时间也关注到了,但又因忙于学业,所以我对于人工智能的了解也只能停留在媒体炒作的文章上。显然,每一次科技的进步都不由的让一些人开始焦虑自己存在的意义——开始焦虑自己被AI取代,失业了怎么办?焦虑AI的出现让更多的毕业生更难找到工作,学历贬值了怎么办?甚至有人拿AI去做高考试卷轻轻松松700+,然后说高考试题考的太“死板”,已经选拔不出人才了。

📰 实际上,我当时就断定如上问题是媒体的炒作的惯用手段,如今,已经过去两年有余,依然认同我当时的观点,有人可能会反驳到:你骗人,明明Microsoft,Google,Oracle…这些巨头在AI出现后裁员那么多,紧接着国内也有裁员风波。这样的反驳,确实让我无地自容。不过我心里却是在想:仿佛每一次科技革命,首先都会引起人们对工作的焦虑——从珍妮纺织机,到蒸汽机,再到内燃机…,仿佛这些人都是为工作而活一样,只是时代变了而已……

🌊 时代浪潮中的个人位置

🎒 而我个人在时代的浪潮中能干什么?珍惜当下的时光才是最重要的,起码在工作之前,珍惜校园里的时光才是目前跟我最要紧的。所以,我想着是呢,谈一谈大语言模型(LLM)对我这一年多来学习CS的影响(谢天谢地,终于回到标题了),毕竟人工智能就是CS的一个研究分支——

❓ 回答标题中的问题

✅ 先回答标题中的问题:在学习方式上,的确有革命性的影响,但这种影响往往体现在学习CS某一领域的前期,因为,随着学习的深入,研究对象逐渐变的复杂,对于如何精确刻化和表述研究对象,这本身就是个问题,更别说再交给LLM了。简单点来说就是:没有“问题”怎么让LLM解决问题?那不成还能让LLM解决“没有‘问题’”的问题?这不可能。

🚀 为什么前期影响巨大

🧩 前期之所以影响巨大,是因为一个人,只要是正常人(抛开陶哲轩,冯·诺依曼,高斯……这种),刚开始接触一个概念他就是比较慢,相应领域的神经元直接还没有链接,但问题是,到了后期,一旦人脑在所学领域的神经元一旦建立起来,就回跟过去已经学过的所有知识进行汇合,你可能回认为,人脑会有遗忘,但人工智能不会遗忘,大错特错!人工智能会“遗忘”!这牵扯到现阶段LLM的实现和训练方式——这种“遗忘”更像是随着神经网络层数的不断增加,对于可能解决问题的“灵气儿”被当成“噪声”,从而被忽略造成的,最终导致的结果就是没有把“关键”输出给用户,受篇幅限制,不在这里展开细讲。

🖐️ 其次,人对于事物的认知可以是多感官——正所谓“五感”,人脑新知识的加入,汇合的是过去所“感觉”过得的东西,这使得人在解决新问题时有更多的方式去得到解决问题的“参数”,而不仅仅是通过文字阐述给LLM。这是LLM最大的问题。

🤖 多模态与机器人

👀 如果我们使用计算机视觉(CV)计算机图形学(CG)的手段把它集成到机器人身上怎么办?别慌,那它也是在“听觉”语言的基础上添加一个通过“视觉”的到的参数,还是没办法跟人比,更何况现在还没有一家公司能做到将“视”“听”集成到机器人身上,现阶段的机器人各家公司都在比谁能把肢体动作做的更像人,而作好肢体动作压根都不是用深度学习算法的得到的!!!什么方式给我忘了。

📷 Google的Gemini可以通过用户的手机摄像头来得到“视觉”参数,但Google Gemini的算力中心,你能想象多大吗?这也是为什么我把标题起作“大语言模型”的影响而不是“人工智能”的影响,就是因为现阶段的大多数人接触到的“人工智能”是只从“视觉”图片和“听觉”文字通过深度学习得到的,所管它叫“大语言模型”更精确一些。

接着再谈一下,关于使用LLM写代码的问题。当我们需要完成一个项目(Project)时,我们需要思考的不仅仅是源代码怎么写,还有背后的业务逻辑!不是说LLM的代码能力不行,而是用LLM生成的根本就不符合你业务逻辑的要求!而且,如果你想修改,又因为不是自己写的接口,就不知道它怎么调用的,更不可能知道它是怎么实现的🙃,这就需要把LLM给的源代码再通读一遍😤,实际读下来呢,如果读懂了,还好办一些,如果读不懂,那完蛋了!🤯这个项目靠LLM根本就完成不了。 最后发现还不如自己写😅,遇到小的问题再问LLM。 LLM的出现只会让原本能力强的人变得更强,他们精通业务逻辑,可以变成策划师,用LLM不过省下更多敲代码的时间而已。 所以,我不认为LLM而不会让一个门外汉变成开发高手,更不可能让他懂计算机科学。

🧭 结语

🌱 总之,大家不要为刚开始的学习来请教LLM而感到沮丧,是否能把知识学下去,才是你超越LLM的必胜法宝。大多数人幻想的人工智能是像电影I, Robot那样,我管它叫“多感官深度神经网络学习”,目前还在理论研究的范畴,真的到工程落地(我都不敢想这个工程能有多复杂),起码未来十年不可能实现。