妈妈们带孩子过来playdate那天,我给她们看了我做的去年的家庭相册。里面大部分是家庭照片,也有其他我认为比较重要的时刻,比方说去H的生日party,回比利时见朋友,和妈妈们的聚会照片,还有几张工作照片。去年四五月份的时候我们公司拿了一个奖,british data award的Analytics company of the year. 那个奖项年份不长,其实AI领域的很多奖项都不是很有历史,大都是近十年的事情,很多甚至近三年五年。那个奖有份量吗?好像也还好。为什么我会去呢?这些奖项一般都是marketing组的人去申请,主要是扩大公司影响力,颁奖礼的时候,一般只有一个C字头会去,其他都是marketing组的人,还有AI组的人去,毕竟是AI领域的奖,着装要求smart,也可以是晚礼服。那次拍的照片我也放家庭相册了。妈妈们看了之后,挨个问我那是什么,我才惊觉,我其实很少把工作和生活混起来,加上自己做的东西又不大容易说明白,所以妈妈们问我做什么的时候,我通常都说我是AI相关的,具体说的话,你们收到的商家邮件推送有我的贡献。从来没有具体到什么算法啊之类的。那天也没有具体聊这个,她们就知道我们公司拿了个奖。我们是个妈妈群,喜欢聊的都是老公孩子之类的话题。人与人相处,有共同话题,舒服就好了。
我到底是做什么的呢?
我大学专业是生物医学工程,专业特别新,老师们好像也不是特别清楚就业前景,我们参观过医院的医疗设备,也简单处理过大脑图像。现在回头看的话,其实这就是这个专业的两个方向嘛,设计医疗器械,和生物医学图像处理,医学图像的图片网上有数据库,但是设计医疗器械真不是我们可以做的。·R硕士博士期间做的是设计MRI的线圈,他本科学的是物理,感觉物理才是医疗器械的基础。我们电路课甚至没有讲线圈。毕业那半年刚好赶上汶川地震,毕业设计草草就了事了,以至于我忘了做了什么了,好像是大脑的图像处理。大学学的东西后来用到过的,是微积分和基本的图像处理原理。当年学的编程语言C++硕士的时候好像还用过,到了博士期间就不怎么用了,现在用的主要编程语言是python和sql。
我硕士专业是人工智能和模式识别,当时的数学学的什么集合之类那门课是完全没学会,忘了个干净。但是当时学的行列式和矩阵转换在博士期间还用到过。李老师教的模式识别的课是有用的,尤其是神经网络,当时推算神经网络的参数,前置后置算法,都是手推出来的。当时的硬件条件不行,不能组建大网络,所以当时神经网络的算法还没有其他传统算法svm之类的更精确。当时因为当时手推参数,所以对那个网络理解特别好。最近几年算力上来了,大网络组建的很好,准确度当然也跟着上来了。硕士的时候去实习,做的是摄像机的烟雾监测,我觉得那个实习经历对我的博士申请帮助很大,因为博士的实验室的一个方向就是多摄像头的监控系统。
博士好像没有专业这个说法了吧?我们实验室是挂在 TELIN Department of Telecommunications and Information Processing 下的,应该是叫做通信与信息处理。我们实验室叫做Image Processing and Interpretation组,其实是做图像处理的,现在大部分留在那里的同学还是做图像处理,有摄像头图像处理,也有地质相关的卫星图像处理,还有同学做过艺术品的图像处理。我当时做过一小段时间的多摄像机标定,那时用到过矩阵什么的,后来就是在处理摄像机画像里的行人轨迹了,后来扩展到老年行为分析(防摔倒),还有车辆轨迹分析等等。现在想想,真是杂啊,教授有很多工业项目,那里申请资金比较容易,就是因为有那些偏工业轻研究的项目,在每个博士毕业后,在找工作的期间,基本教授都会给个博士后的头衔继续待在实验室,给发工资。虽然我做的东西好像很杂,但是其实都是数据而已,图像也是数据,只不过是在三维数组里数据而已。
来英国之后,工作的title都是data scientist 大数据科学家,有时候前面加个senior或者lead。第一份工作分析英国最大的连锁咖啡店的客户数据,主要是银行转账数据,分析客户喜欢什么,计算客户的clv (customer lifetime value)。如果说读博期间主要侧重于提出新算法,那工作期间就是把已经发表或者成熟的算法用在自己工作中。clv的计算算法都是现成的文章,自己写代码来用就好了。后来有人甚至出了个程序包给大家用。那时候处理也就是几十万的用户数据,咖啡企业本身的用户远不止这些,但是我们只有用了我们的刷卡机的店的交易数据,模型训练在自己的电脑上就能完成。我们的工作成果主要给campaign组的同事用,应该是广告组,给他们的广告推销活动找目标用户。当时相对我们公司的竞争对手,我们的app设计功能都远不如人家,唯一做的好的就是我们数据组比人家都更先进,这导致公司对我们组的投入减少,加大了对app功能的开发。我当时在那个公司学的最多的是计算clv,处理数万级的用户数据。我当时拿个巨大的白纸手推公式计算clv,当时感觉就是,虽然data science当时非常火,网课很多,好像随便一个谁上个网课就能做data scientist了。但是我当时觉得人工智能的各种模型的原理和数学功底其实对一个人的发展前景是重要的。当然我现在觉得他们的重要性降低了。
第二份工作是矿山工地行业,给大型机械装上传感器,用传感器分析机器的运行效率,实时显示机器的运行状态,后来还加上燃油传感器,分析用油率,预测下次加油时间,设计防偷油算法。我是怀着孕找的工作,工作了六个月就生了个娃,请了三个月的产假,当时产假期间也有帮公司处理些问题,是我自己主动要求的,说他们当时招的那个代替我工作的人如果有困难,可以直接联系我。当时公司对那个短期工不是很满意,我生二宝的产假公司都没有再找人代替我,因为我是做数据处理,模型训练的,只要模型训练好了,没有新的训练需求,只是维护的话,公司的几个backend engineer也可以上手,公司甚至给了我四个月的带薪假。在公司五年,生了两个娃,工作内容简单,模型用的是最简单的传统模型,不涉及人工智能网络,公司每年都有奖金和差不多一样的股份分红,日子过的非常舒服。当时在模型训练上没学到什么,用户数据也不是很新鲜,但是学了怎么把模型应用到GCP(google cloud platform)上去, 怎么实时处理数据,怎么监控模型在云上的运行情况。我们公司的scalability能力不行,处理上千台机器数据还行,没有能力处理上万台的数据,后来矿山,还有机器制造业都开发我们一样的东西,我们公司就有点不上不下卡那里了。最后CEO把公司卖给了一个投资公司,大家感觉风向不好,就都开始找工作了。我们几个manager离职后,投资公司很快就把我们公司在英国的业务全部关掉了,只留下了印度的业务。
现在的工作是第三份工作,主要处理weblog数据,就是网页浏览数据,不管是电脑上的还是手机上的,这个数据是网络运营商提供的,我们的工作主要是分析用户对一个品牌或者一个品牌类别的感兴趣的程度,成果也是给campaign组的同事用,他们用来找目标客户群。其实跟第一份工作有点像,但是现在的数据才是真正的大数据,处理的都是上千万用户的数据。终于开始用大型的神经网络模型了,tensorflow不止是拿来练手,而是用来设计神经网络处理千万级的用户数据了,也终于开始上手spark,databricks,等大数据处理需要的工具了。所以去年大半年我都处于学习的状态,因为有新客户onboarding,所以学习了我们的模型,读懂了那个代码,拿到了新客户的数据,立马拿来应用,用新数据训练模型,得到的结果立刻给CS组的同事validate,上传到新客户的dashboard,简直没有比这更完美的学习过程了。后半年我们公司来了个新的CTO,他对我们的大模型处理不是很满意,他在cursor的帮助下直接用LLM为基础写了个大型的程序,不再用神经网络模型处理用户数据,都交给LLM来处理。我又开始学习怎么用现代工具cursor来帮助自己写代码,找bug,怎么看懂cursor写的代码。
倒回来说吧,大家平常生活会用的词叫做AI (artifical intelligence), 人工智能。这是个泛称.
Artificial Intelligence (AI) is the ability of computer systems to perform tasks that typically require human intelligence, like learning, reasoning, problem-solving, perception, and language understanding, by processing vast data to find patterns and make decisions, enabling machines to simulate cognitive functions and act autonomously or with human guidance。
人工智能(AI)是指计算机系统通过处理海量数据来发现模式并做出决策,从而执行通常需要人类智能才能完成的任务的能力,例如学习、推理、问题解决、感知和语言理解。人工智能使机器能够模拟认知功能,并自主或在人类指导下行动。
从算法上来说,AI可以用传统的机器学习Machine Learning,也可以使用神经网络的深度学习Deep learning。AI的应用范围很广,普通人熟悉的是NLP natural language processing, 也就是时下流行的ChatGPT, DeepSeek等,他们的主要功能对普通人来说就是处理自然语言,也就是对话,你用你的语言,文字也好,语音也好,发给它,它可以理解,并给予回应,甚至执行你的指令,比方说在网络上搜索个什么。
ChatGPT 和 DeepSeek其实是两个LLM large language model产品,他们各自都有一系列的模型,侧重点和应用范围稍微不同, 但是都是用来处理人类自然语言的模型。但是对普通人来说,没有多大区别。这些模型都是使用各种类型的神经网络构成的,训练成本特别高。


大概最近十年,AI领域的投资大多在训练这些模型上,让他们能够正确理解人类的自然语言。大概从去年或者前年开始,chatgpt 和deepseek爆火,很多普通人开始使用,这样的情况下,相当于给了这些模型更多的训练样本,通过强化学习,各个模型的准确率更高,能更好地理解人类语言了。所以这两年投资开始转移到怎么让这些模型落地到各个产业上来。比方说我们的客户的marketing组想建立一个campaign推广,需要理解客户的推广需求,了解用户数据情况,到数据库调数据,需要建立推广,找到目标用户,发送推广,这些都几个组的协调工作。但是如果引进AI的话, 给予AI访问我们的数据的权限,而且它又有理解自然语言的能力,所以markting组的人只需要和AI使用自然语言沟通就够了。但是受到GDPR的限制,就是对于用户数据隐私权的保护,你不能随便给AI对你数据库的最高权限,要根据应用来决定能给什么权限,所以最近一年比较火的MCP (Model Context Protocol) ,就是一套从AI应用到外部系统的链接标准,统一设置是不是授权AI agents访问网络,使用一些其他工具,或者链接到日历代码库等等。
好像有点太深入了。总之,LLM大语言模型的训练拿到的投资越来越少,LLM大语言模型的应用拿到的投资越来越多。当然这就意味着做训练的人越来越少,做应用的人AI Engineers越来越多,短期来看,从事data science或者AI的这个领域的人还是很多,只是方向转移了。
对普通人来说,很多可重复性的数据分析类的工作正在逐渐被AI替代,但是高级分析,对于复杂问题的理解类的工作还在,短期内AI替代不了。我自己有时候刷短视频,不管国内还是国外的大佬,经常听到他们都在说程序员要被AI替代了,其实听听就好了,他们说的是简单的可重复性使用的程序可以用AI来写,暂时不是那种逻辑特别复杂的工作。但是AI的学习能力和修正能力很快,现在很多程序员都在用AI辅助自己写程序,监督AI工作并给予修正,也许过不了几年,大型的复杂问题对AI来说也不是难事儿了。
对我自己来说,cursor(一个使用LLM来帮助程序员写程序的辅助产品)确实可以帮助我快速地写程序,找bug也非常快,甚至程序设计都比我做的好,我平时不太用到的batch inference, concurrent processing之类的模块它做的非常好。我最近使用的感受就是学到了很多,但是也发现了它本身一些问题。如果程序运行出错,它最喜欢做的是使用try except,增加fallbacks,把所有edge cases都包括进去,反正最后你的程序能运行就行了。这就导致程序巨大,bug的根本原因还是没找到,潜在问题还在。因为程序巨大,加上发展速度过快,开发者很多时候都不记得最初设计了些什么东西,可能会造成后续的很多问题。我最近在CTO的那个项目里找到个大bug,就是可能在开发过程中,一个数据库给做了partition,后来不再使用了,但是当初根据partition调用数据的filter还在,导致后面没有被partition的数据在处理过程中被丢掉了。这种bug,本身看程序看不出来,让cursor自己找也找不出来。是CS组的同事发现问题,我在找问题根源的时候,抽丝剥茧找出来的。这种级别的分析能力目前来说不能指望AI来做。
对于data scientisit这个工作来说,我以前觉得数学和对模型底层原理的理解很重要,但是我最近开始觉得他们的重要性在下降。最近比较火的AI engineers的工作,要求的大都是有使用LLM agents和MCP的经验,跟数学什么的没有多大关系了。等LLM在各类行业落地后,这类工作也会减少。
那么在这个多变的世界里,什么最重要呢?目前来说,我觉得学习能力最重要,尤其是自学能力。听起来好像很玄,但是这就是我目前认为的。从我自己的几份工作来看,微积分和神经网络肯定是有用的,但是不断地学习才是我还没有被淘汰的关键。我也不知道我还能学习多少年,五年内估计还行,不知道再过五年我的学习能力会不会下降,反正先学着嘛。
说回博士这事儿吧,十年前做data scientist,招工标准里经常写要么博士毕业,要么需要几年的工作经验。所以我那时没有博士学历的话肯定进不了这个行业。对于我的同事们来说,他们本科或者硕士期间就在实习了,实习的经验也很重要,很多时候毕业就留在实习的公司了,过几年换个公司也可以升为senior。所以我觉得如果不是那么喜欢学术,一定要在学术圈里混的话,那拿个硕士学历就够了,早点出来见见真正的大数据,真正的应用平台更重要些。
所有这些都是在2026年初的我的感受,也许过不了几年,世界发展这么快,我的感受也会更新吧。
最后说点新鲜事儿吧,最近最火的AI项目是什么呢?Openclaw, 一个辅助处理个人事务的AI,用它来建立你个人的AI Agent,给它你的社交媒体和邮件的访问权限,它会自动帮你写追踪有空,预约,设置提醒等等。你也可以把你的Agent送到Moltbook一个专门给AI Agent建立的社交网络,它还可以和其他人的AI Agent进行交流。
Openclaw什么时候出现的呢?2025年十一月份,短短三个月已经火出圈了,国内几大科技公司都在接入或者开发自己的版本。这几个月它已经改了三次名字了 Clawdbot, Moltbot, OpenClaw
一个人的AI跑去和其他人的AI交流,自动修正bug,讨论自己是不是虚拟意识,这个世界是不是有点疯魔了
我当然没有在openclaw.ai注册自己的AI agent,给予它自己个人社交账户的访问权限,我还是觉得不太安全,周一和同事讨论下再说
