您当前的位置:中国教育品牌网资讯正文

我所知道的裴健和华人数据挖掘大牛们中国人工智能简史

放大字体  缩小字体 2019-09-22 21:49:04  阅读:4844 来源:自媒体作者:左林右狸

原标题:我所知道的裴健和华人数据发掘大牛们 | 我国人工智能简史

裴健在 CCF-GAIR 2018 上

文 | 林军 岑峰

近来加拿大皇家科学院发布了新中选的一批院士名单,其间 CCF-GAIR 2018 的讲者、加拿大 Simon Fraser 大学核算科学学院教授裴健中选,是本次中选的四位核算机学科院士之一。

借此,左林右狸频道八一八新科院士裴健以及在数据发掘范畴的许多华人之光。这也是《我国人工智能简史》的系列剧透之一,是的,大叔在欢腾新十年的一起也在与岑峰一起创造《我国人工智能简史》,创造结束时间节点大约在冬季,出书时间应该在下一年春天。

左林大叔与裴健的结缘始于 2017 年,从 2016 年起,雷锋网活跃参加了十余个世界尖端 AI 学术会议的报导,其间包含在加拿大哈利法克斯举行的 SIGKDD 2017。就在 SIGKDD 大会前,裴健履新成为 SIGKDD 的主席,咱们对裴健也进行了专访,也便是在这届大会上,雷锋网向裴健介绍了咱们与 CCF 联合举行的 CCF-GAIR 大会并邀请他来做讲演,裴健怅然答应。

在 2018 年的 CCF-GAIR 大会上,履新京东副总裁的裴健结合在企业界的实践做了题为《才智供应链》的讲演,共享了才智供应链带动制作和流转职业降本增效的心得,是大会最受欢迎的讲演者之一。

2017 年 KDD 大会上,裴健正式就任 SIGKDD 主席,

右为上一任主席刘兵

裴健中选加拿大皇家科学院院士可谓华人数据发掘范畴的一件大事。数据发掘的概念开端在 1995 年提出,相关于核算机科学的其它学科,数据发掘归于近年来才得以迅速展开的一个方向,此前在 2004 年,吴建福教授作为榜首位核算学者中选美国国家工程院院士,也是华人核算学者中选干流国家院士榜首人。

而尔后真实由于数据发掘成果中选院士的研讨者寥寥无几,在左林大叔的形象中,在华人中只要清华校友、英国帝国理工学院数据研讨所所长郭毅可 2018 年中选英国皇家工程院院士,不过工程院院士更多反映的是在工程项目上的才能,而科学院院士的评选更为重视学术研讨才能,以裴健在数据科学的影响力来看可谓实至名归。

多说一句,雷锋网的另一位老朋友也是 CCF-GAIR 2019 的讲者邓力是加拿大皇家工程院的院士(加拿大皇家工程院与皇家科学院的异同大略与我国工程院和科学院的异同差不离),邓力在深圳期间也给咱们叙述了当年他与陆奇、余凯的往来故事,以及微软百度谷歌三家抢夺 Hinton 团队的江湖轶事,十分精彩,咱们也会在《我国人工智能简史》里逐个出现。

加拿大皇家工程院院士邓力在 CCF-GAIR 2019 大会上

回来八裴健,在左林大叔看来,裴健成为数据发掘范畴名副其实的领军人物的原因在于他的全面性:学术方面,他宣布了 200 余篇论文,被引证 8 万屡次,并因在 Frequent Patterns 的相关研讨取得了 SIGKDD 2017 的创新奖(Innovation Award),是第三位取得该奖项的华人,在他之前取得过该奖项的两人别离是韩家炜(2004)和俞士纶(Philips S. Yu,2016)。

他仍是第三位取得 KDD 出色服务奖的华人,在2015年他获奖之前,取得该奖项的华人包含清华的吴信东(2005)、Ying Li(2012);他是第二个担任 SIGKDD 主席的华人,此前担任过该职位的华人是伊利诺伊大学的刘兵(记住裴健在 2017 年的专访也说到刘兵对其的潜移默化);而此次中选加拿大皇家科学院院士,则是华人在数据发掘范畴的又一个里程碑。

裴健别离于 1991 年和 1993 年在上海交通大学核算机科学与工程系取得学士与硕士学位。前两年曾为中央领导解说大数据概念的梅宏院士,博士也是在上海交大,和裴健系出同门,两人在交大时就熟悉,有着二十多年的友谊。梅宏博士结业后到北京大学做杨芙清的博士后,裴健也到北京大学持续攻读数据库方面的博士。

1998 年,由 IBM 赞助,复旦大学举行过一次数据发掘的评论班,这也是我国最早的数据发掘交流活动,其时请来的主讲教师是陆宏钧和韩家炜,这一评论班为参会的师生推开了数据发掘的大门,从这一点讲,韩家炜无愧于我国数据发掘的引路人。其时裴健还在北大读博士,在评论班中他提出的问题颇有深度,给韩家炜留下了深入的形象。一年后裴健来到加拿大,到韩家炜麾下攻读 PhD。

2000 年,裴健与韩家炜宣布了《Mining frequent patterns without candidate generation》一文,这篇文章被引证 8000 屡次,也正是这一研讨使得裴健成为世界数据发掘界的学术之星;当然,让裴健影响力到达高峰的是他在 2011 年与韩家炜编写的经典教材《Data Mining: Concepts and Techniques》,这也是全世界学习数据发掘的学生的首选教材。

韩家炜在数据发掘、数据库和信息网络范畴宣布论文数百篇,在 Google Scholar 上的被引证量挨近 17 万次,h-index 高达 169,被称为“数据发掘榜首人”。韩家炜父亲上海交大结业,是郑州纺织机械厂任财政科长兼总会计师。韩家炜是家里四个孩子中的老二,不只提前读书,后来还跳了一级,1966 年文化大革命开端的时分,韩家炜刚刚从郑州七中读完高中,文革期间就地就读郑州大学并以工农兵学员结业,假如不是文革,韩家炜像他哥哥和父亲相同考个交大应该是没有问题的。

韩家炜在 CCAI 2018 我国人工智能大会上

1978 年康复高考后,韩家炜便报考了中科院的研讨生,由于其时中科院挂着我国科技大学研讨生院的牌子,因而也有不少人错以为韩家炜是中科大的结业生。实际上韩家炜在中科院的研讨生只读了一年,第二年他就考取美国公费留学的名额。在威斯康星麦迪逊大学读博士期间,他开端先是做核算机数据库的专家系统,后来专家系统遭受窘境,考虑到研讨方向的展开前景问题,随后又挑选了相关数据库作研讨方向。

韩家炜的这一挑选也刚好赶上了常识发现的风口。跟着数据库技能的展开使用,数据的堆集不断胀大,导致简略的查询和核算现已无法满意企业的商业需求,而人工智能在专家系统上遇到窘境,也急需一个新的场景落地。所以数据库与人工智能两者的结合促生了一门新的学科,即数据库中的常识发现(Knowledge Discovery in Databases,KDD)。

1989 年 8 月举行的第 11 届世界人工智能联合会议的专题评论会上,初次提出了常识发现(KDD)这个术语,并在 1995 年举行了榜首次 SIGKDD 大会,韩家炜正是 KDD 前期的组织者和参加者。在 SIGKDD 大会上,韩家炜组也是宣布论文最多的研讨团队之一。

韩家炜是被 KDD 社区认可的榜首位华人,他于 2004 年在 SIGKDD 大会上取得创新奖。第二位被颁发重要奖项的华人是吴信东,他取得的是 2005 年 SIGKDD 的出色服务奖。

吴信东的故事颇有戏剧性,他本、硕均结业于合肥工业大学并留校,1991 年到英国爱丁堡大学攻读博士学位,之后一向从事数据发掘与常识处理方面的研讨。吴信东在还没有到英国读博士之前,就有给常识与数据发掘范畴最好的期刊TKDE(IEEE Transactions on Knowledge and Data Engineering)投稿,但一向屡投不中,屡败屡战,直到博士结业后的 1998 年才总算投中了榜首篇 TKDE。

到了 2005 年,吴信东成为了 TKDE 的主编,完成了“从奴隶到将军”(吴信东自称)的改变。或许是对投论文的困难进程深有体会,他兴办了数据发掘范畴的尖端会议 IEEE ICDM,这一学术会议后来成为不少华人学者的发声渠道,在协助提高华人学者在常识工程和数据发掘范畴的影响力方面起到了活跃效果。

明略数据首席科学家和副总裁 吴信东

2001 年,韩家炜从 Simon Fraser 大学转至 UIUC 任教。UIUC 也是许多留学生偏心的校园,其特色一是相关于藤校和斯坦福伯克利这一等级的抢手校园要相对好请求一些,二是出门的上限高,假如你满足勤勉和尽力,这儿的名师必定不会让你绝望。华人核算机视觉的灯塔黄煦涛,便是在 1980 年从普渡大学来到 UIUC(在《我国人工智能简史》一书视觉一章里,黄老先生的故事支撑了整个华人核算机视觉研讨起承转合的起)。

韩家炜的到来,让 UIUC 也成为了数据研讨的重要基地。韩家炜在 UIUC 期间,每年都从国内接收学生,每年报考人数数百名,终究成为他学生的能够用“百里挑一”描绘。韩是那种自己学术做得极好,还能把学生培育好的极为罕见的教师,除了前期的裴健等学生,后来在UIUC培育的学生还包含严锡峰(UCSB)、蔡登(浙江大学)、朱飞达(新加坡办理大学)、保全全(UCLA)、孙怡舟(UCLA)、任翔(USC)等学术新星和柳超(天眼查)等创业者。不过传言 2019 秋季将是韩家炜终究一次招博士生,之后再拜入韩门,只能从第二代弟子做起了。

韩家炜后期带的学生时常将裴健这位“大师兄”作为学习的典范和赶超的方针,傍边也发生了一些风趣的故事。例如在 2010 年的 ECML-PKDD 上,韩家炜做了一个题为《结构便是信息:发掘结构信息网络》的主题讲演,在发问环节,另一位大牛 Christos Faloutsos 举手问道:“你做的这个网络很厉害,可是你能否猜测到我下一年写什么文章?”韩回答道:“我连自己的都猜测不到,更别提你的啦。”回去后韩家炜将这个笑话讲给其时还在他手下读博士的孙怡舟听,孙怡舟很严厉地以为这不是一个简略的笑话。通过剖析和评论后,韩家炜和孙怡舟定了一个新课题,猜测 Christos 往后几年会和哪些新的作者协作。

伊利诺伊大学厄巴纳-香槟分校(UIUC

2011年在ASonAM 上,孙怡舟宣布了一篇影响力巨大的文章《Co-author Relationship Prediction in Heterogeneous Bibliographic Networks》,在文章中,孙怡舟依据 1996-2002 年的数据,猜测大师兄裴健在 2003-2009 年间会有哪些协作者,排名前五的猜测中只要一个没有出现。而实际上裴健也和这位作者有协作,只不过他们协作的论文要晚两年,在 2011 年才宣布,没有被核算进测验会集罢了。数据发掘大牛的世界还诚心遵从数据发掘的规则啊。

另一位从Simon Fraser大学走出、受韩家炜影响的大牛是杨强,哪个杨强,便是最世界化的华人 AI 大牛,IJCAI 2019 的理事会主席杨强。杨强父亲是北大天文学家杨海寿,因而杨强开端也子承父业,1982 年考取了李政道的中美联合培育物理类研讨生计划(CUSPEA)来到美国马里兰大学学习天体物理。

杨强是一个对新鲜事物特别感兴趣的人,早在 1980 时代初还在北京大学写论文的时分,他就被其时的小型机所招引,焚膏继晷地研讨核算机,并在核算机上编写了一个游戏程序,后来在美国做太阳耀斑活动(对,便是《漂泊地球》里导致地球漂泊的原因)研讨的时分,还用核算机做了一个 3D 模型。

但真实将杨强引上核算机路途的是其时也在马里兰大学学习的彭云,彭云是勇士江姐的儿子,也是文革后留学美国的学生中,最早研讨人工智能和在美国取得核算机教职的人。受彭云影响,杨强不只在拿到天文学的硕士后又拿了一个核算机硕士,之后在攻读博士时,也改行挑选了做人工智能与逻辑推理的方向。

杨强中选新任 IJCAI 理事会主席,现场评选成果图

杨强在马里兰大学拿到博士学位后,先后在滑铁卢大学和 Simon Fraser 任教,也正是在 Simon Fraser 与韩家炜同事期间,杨强触摸到了许多关于数据发掘的东西。其时杨强刚刚拿到终身教职,他期望去做一些能够处理实际问题的研讨而不光是写论文,所以挑选了根据实例的推理(Case base Reasoning)方向;而数据发掘正好能与他所做的这方面研讨结合起来。所以杨强今日所做的搬迁学习、联邦学习以及大数据方面的研讨,其实能够从 Simon Fraser 时期算起。

杨强与裴健也相关颇多,当裴健来到 Simon Fraser 攻读韩家炜的博士生时,杨强刚好是核算机系研讨生院的Chair,因而裴健来到 Simon Fraser 时终究是杨强签的字,在之后的学术研讨中杨强也对裴健给予了许多支撑和鼓舞,后来两人也有许多交集。这两个人的联系像极了机器人范畴的两位超级大牛 Vijay Kumar 和徐杨生,他们在卡纳基梅隆大学相遇时也是一个刚刚博士结业的青年教师,一个是博士生,这种明师实友的往来成为他们一辈子最爱惜的芳华财富。

Vijay Kumar是 CCF-GAIR 2016-2017 两年的明星讲者,而徐杨生是 CCF-GAIR 最重要的建议人之一,大叔作为 CCF-GAIR 的建议人之一从前与徐杨生校长一起招待并陪同 Vijay Kumar前后多日,目击了 Vijay Kumar与徐杨生之间跨过时空的友谊。

回来八杨强,1998 年,李开复筹建微软我国研讨院时力邀杨强“回我国来看一看”,恰逢杨强次年有一段学术休假日,所以便使用这一时机来到了微软我国研讨院。杨强协助微软做了我国最早的一个查找引擎,他在微软亚研做项目到 2000年(大叔的师兄王海峰也在此期间参加该项目,算起来,王海峰也是我国最早做查找的几个人之一,王海峰今日升任百度 CTO,也是名至实归),直到微软决议把查找引擎的研讨拿到总部去做停止。

在微软亚研的阅历让杨强感觉到了我国正在鼓起,开端动了回来的想法,但考虑到国内研讨的根底环境,终究与家人商议后挑选了一个折中计划,去了香港科技大学,与国内和世界学术界、工业界均坚持严密的协作。2004 年和 2005 年,杨强团队接连两年在 KDD Cup 上取得冠军,杨强自己也在 2010 年担任 SIGKDD 的程序主席及 2012 年北京 SIGKDD 的大会主席(这一年 SIGKDD 的程序主席正是裴健)。

2005 年杨强(右二) KDD Cup 夺冠相片,右一为沈抖

也正是在 2012 年,在任正非的推进下,华为开端重视大数据并在香港建立了诺亚方舟实验室,杨强任首任主任,下一任者还有今日去了今日头条的李航。

杨强从前告知左林大叔,诺亚方舟的开端方针尽管是大数据,但他以为其时 Hadoop、Spark 这些东西现已比较老练,因而提议将一大部分资源放到人工智能与机器学习的研讨上。其时人工智能正处于低谷,诺亚方舟作为榜首批做人工智能的工业实验室,关于期望去工业界的博士来说仍是很有招引力的。

其时 Yann Lecun 还向杨强引荐了几个博士后,条件都谈得差不多了,终究这几个博士后仍是被一家在英国的草创公司“截胡”了。又过了几年,杨强在新闻上再一次看到了这家草创公司的姓名:DeepMind。假如这几个博士后挑选的是诺亚方舟,不知先做出 AlphaGo 的会不会是华为呢?

就在 AlphaGo 大杀四方的 2016 年,杨强建议建立了 ACM 数据发掘我国分会(KDD China)并担任主席。仅在 2016 年,KDD China 就现已组织了十项活动,大力促进了 SIGKDD 在我国的展开,为我国工业和学术界之间架起了桥梁。正由于多年来在数据发掘范畴的特殊服务和奉献,杨强在 2017 年的 SIGKDD 上取得了出色服务奖。

和杨强相同横跨机器学习和数据发掘两大范畴的还有南京大学的周志华。周志华本硕博均在南京大学,是人工智能界佼佼者中罕见的本乡博士。周志华的导师是陈世福,陈世福教研组首要的科研项目方向是专家系统,周志华自己进入其时尚属冷门的机器学习范畴,一向坚持了下来。由于其时“数据发掘”比“机器学习”更简单被使用单位了解,他也展开了作为机器学习使用的数据发掘研讨作业。2007 年的 PAKDD 在南京大学举行,杨强和周志华正是大会的两大 Program Chair。

周志华

趁便说一句,PAKDD 现在在 CCF 的世界顶会名单上尽管仅仅 C 类会议,实际上却是数据发掘和常识发现范畴前史最悠长、抢先的世界会议之一(像吴信东兴办的 ICDM 归于后起之秀),在国外口碑很好。榜首届 PAKDD 于 1997 年在新加坡举行,榜首届委员会中的华人包含刘兵和刘欢,其时两人均在新加坡国立大学任教,归于近水楼台先得月。

刘兵后往来不断往俞士纶坐镇的伊利诺伊芝加哥分校,不只活跃参加KDD社区组织作业,在1998年宣布的《Integrating Classification and Association Rule Mining》及2004 年宣布的《Mining and Summarizing Customer Reviews》别离在 KDD 2014 及 KDD 2015 年接连两届取得时间查验奖,他自己也在 2013 年被中选为 SIGKDD 榜首位华人主席。

刘欢则是前往亚利桑那大学,他自己也是横跨信息检索与数据发掘范畴的高被引学者,在他的带领下,他的两个学生胡侠、汤继良也活跃参加 KDD 社区活动,担任了近几届 SIGKDD 大会的分范畴 Chair,胡侠仍是 CCF-GAIR 2018 和 CCF-GAIR 2019 两届的明星讲者。

周志华在2004年在南京大学创建了机器学习与数据发掘研讨所(LAMDA),通过十余年的展开,LAMDA 已成为国内机器学习与数据发掘最具影响力的组织。杨强建议建立 KDD China,周志华出任 KDD China 副主席,另一位副主席、百度高档副总裁沈抖是杨强的博士生。杨强团队在 2005 年 KDD Cup 夺冠,沈抖便是其间一员,也是公认的一号位。

这一年夺冠部队里,有一位咱们的老熟人,也是 CCF-GAIR 2017 的讲者,IPin的联合创始人潘嵘,其时潘嵘在给杨强做博士后。还有一位杨强的博士后,后往来不断微软的孙剑涛,其他的则都是杨强教授的博士:潘军锋(FB) ,吴康恒(香港某科技公司),寅洁(澳洲)。杨强教授的学生里还有一位不是博士生胜似博士生的超级大牛戴文渊,戴文渊今日是数据发掘和深度学习明星公司第四范式的创始人,也是交大 ACM 班的明星学生之一,戴文渊和交大ACM班的故事也是咱们《我国人工智能简史》的重要章节。

榜首届 KDD Cup 于 1997 年举行。作为现在数据发掘范畴最有影响力、最高水平的世界尖端赛事,KDD Cup 每年都会招引世界数据发掘界的顶尖专家、学者、工程师、学生等前来参赛。它被称为大数据范畴的“奥运会”。

KDD Cup 1997 猜测出最或许的善款捐赠人

KDD Cup 的标题大都着重实用性,历年的竞赛所用数据往往被数据发掘从业者用作研讨和开发的出色练习数据。KDD Cup 前期多为大学来承办,近 10 年来多为企业承办,也反映出有价值百科的大规模数据逐渐从研讨组织转向由业界公司把握的趋势。

早在 2004、2005 年,香港科技大学教授、IEEE Fellow 杨强就作为领队引导其团队接连两年拿下 KDD Cup 竞赛冠军。略有不同的,2005 年杨强是亲自带学生,2004 年 KDD Cup 是杨强与中科院高文团队协作,当年的试题之一是蛋白质同源性猜测,生物信息检索正好是高文教师研讨的方向之一,2002 年,高文课题组成功请求到国家 973 项目下的“根据信息技能的蛋白质组研讨”课题,这或许正是我国部队在这一年的 KDD Cup 取得打破的原因。

高文在 CCF-GAIR 2018 上

言归正传,KDD 2004 的赛题要求参赛者运用各种数据发掘、机器学习手法从练习数据中找出规则,将康奈尔大学开发的蛋白质折叠辨认程序LOOPP 生成的 74 个蛋白质同源性衡量目标合并成一个同源性打分函数,对数据库中的蛋白质与查询蛋白质之间的同源性进行猜测。这一标题有三个难点:一是数据具有块结构方式;二是练习样本数量巨大;三是练习数据的类别散布极点不平衡。

关于这一问题,其时的干流办法是使用SVM和最大熵等判别模型来结构排位函数,高文则是在此根底上,使用了一个线性判别模型合并从隐马科夫模型导出的多个特征,终究这一办法有效地提高了检索函数学习的准确性,从而在 KDD CUP-2004 蛋白质同源性猜测问题上得到了十分成功的使用。

终究的猜测成果取得了 APR 和 RMS 目标榜首名,TOP1 目标第二名,RKL 目标第十四名,归纳成果并排榜首名的成果。这是我国研讨人员初次在 ACM KDDCUP 数据发掘竞赛取得优胜。这也是我国的学术研讨人员在世界顶会的竞赛项目取得冠军的最早打破之一,之所以说是之一,是几乎是同期,丁晓青团队在 ICPR 上取得 FAT 2004 人脸竞赛的榜首名。

依照大叔的大学同学,也是 KDD Cup 2004 年的冠军成员之一的山世光的描绘,这次夺冠的榜首主力是付岩,付岩后来从核算机去了数学所,其时是核算所两位教授高文和贺思敏一起的博士生,贺思敏是这次竞赛夺冠的 leader,另一位主力王瑞祥也是其时贺思敏团队成员。

山世光

哦,忘了祝贺山世光名列 2019 腾讯首届科学探究奖的 50 名青年科学家部队。

说来也巧,周志华作为香港科技大学核算机系延聘的不多几位内地荣誉兼职教授,榜首次到香港科大拜访时,去接站的便是其时在读博士生,KDD Cup 2005 的榜首主力沈抖。沈抖结业后进入工业界,在参加百度前是微软西雅图 AdCenter 实验室的研讨员。

KDD China掌管具体作业的负责人秘书长郑宇,现任京东副总裁,之前是微软亚洲研讨院的明星研讨员,同样是 CCF-GAIR 多届明星讲者,2016 年榜首届 CCF-GAIR,郑宇便是程序主席,为 CCF-GAIR 大会做了不少作业。

郑宇也仍是 KDD 社区的活泼组织者。他从 2011 年开端参加 SIGKDD,之后每年的 SIGKDD 大会都会参加。郑宇很早就在 SIGKDD 上举行城市核算的 Workshop,到本年(2019年)现已是第八届。从 2016 年起,KDD China 在 SIGKDD 上开端举行"Data Science in China "论坛主题活动,活动的首要组织者也是郑宇,这一活动的举行也有力展现了我国在数据发掘范畴的实力。

京东集团副总裁郑宇在 IJCAI 2019 大会上

假如说 2016 年是华人在数据发掘范畴全面发力的拐点,那么接下来的时间则是华人数据发掘的高光时间。在 SIGKDD 2017 上,不只裴健接任刘兵中选 SIGKDD 主席,在三大奖项中,杨强取得出色服务奖、裴健取得创新奖,华人得其二,此外,本届大会的最佳使用论文被西弗吉尼亚大学叶艳芳团队取得,一起我国部队包办了这届 KDD Cup 的一切奖项。

在接下来的 SIGKDD 2018 上,不只刘兵、唐杰再度包办创新奖及出色服务奖两项大奖,郭毅可、唐杰、熊辉、林智仁、杨强等人担任了大会主席、副主席、程序主席、评奖委员会主席等重要人物,在评奖委员会的八人名单中,华人更是占到五人(杨强、韩家炜、裴健、王薇、俞士纶),“我国力量”俨然成为这几年 KDD 的主基调。

在左林大叔看来,在许多人工智能相关的范畴中,数据发掘是华人参加度最高、也是最有望完成逾越的范畴。这不只仅由于着重“着手才能”的数据发掘更能发挥我国人的利益,还由于数据发掘是一门与工业亲近结合的学科,我国巨大的商场与人口基数,以及新一批互联网科技公司的茁壮成长,都为我国人引领世界潮流供给了坚实的根底。

罗马不是一天建成的,今日数据发掘范畴所出现的“我国力量”,有数据发掘老中青三代人的不懈尽力,更离不开研讨者们的薪火相传。不过关于数据发掘的故事,大叔更乐意用有利地势有利地势人和来描绘:

所谓有利地势,是韩家炜、俞士纶、陆宏钧等最早一批进行数据发掘的研讨者,恰逢数据发掘鼓起之时就活跃参加其间,为后来华人社区的强大打下了坚实的根底;

所谓有利地势,是从上世纪 90 时代起我国高速展开鼓起的过程中,对数据发掘的旺盛需求为新一批数据发掘中坚力量的鼓起供了出色的时机;

所谓人和,是裴健、杨强、刘兵、刘欢、周志华、吴信东、郑宇等之后一批数据发掘的领军人物与中坚力量发挥了承上启下的效果,在参加数据发掘社区活动的一起,活跃带动其他后起之秀参加到社区中来,使得华人赢得了数据发掘社区的尊重。

KDD 2017 China Day 合影

前排左起:刘兵、韩家炜、杨强、裴健

后排左二:郑宇 左四:刘欢

从职业周期的视点看,从 1989 年常识发现的概念提出到今日,数据发掘刚刚走过了三十年的一个完好周期。从这一视点看,颁发裴健院士是一个必定的信号,也预示着数据发掘下半场拉开了前奏。

再度祝贺裴健被评为院士,也祝贺投身数据发掘范畴的各位研讨者们,你们正站在一个新时代的起点。大叔估计在不久的将来,这个范畴会有更多的研讨者取得他们应有的荣誉,也期望各位研讨者们在未来三十年中坚持初心,壮志前行,持续书写数据发掘的光辉。

数风流人物,还看今朝。

责任编辑:

“如果发现本网站发布的资讯影响到您的版权,可以联系本站!同时欢迎来本站投稿!