DOIT资讯 2月16日国际报道: 昨天上午8点开始,Watson正在美国比赛现场,挑战两位智力竞赛达人,IBM中国研究院的数位专家:潘越、倪渊、滕晓菲及张雷正在新浪微博上现场解答网友提问,而ID为IBM100的微博帐号正在做文字现场直播。
今天上午8点开始,人机大战继续进行,据IBM中国研究院-滕晓菲(新浪微博ID)透露,今天比赛的6个类别题目分别是 etude, hedgehog-podge, don't worry about it, the art of the steal, cambridge, "church" and "state",同时,IBM中国研究院的专家们邀请了IBM美国同事Leiguang Gong, Xiaodong Cui, Kavitha Srinivas帮做现场报道。
在比赛的开始阶段,Watson的分数不断领先,从答对两题奖金数7000开始,14600、21035、28681、30681一路领先至36681美元奖金,而此时人类选手的奖金分别为2400美元和5400美元,但随后Watson因答错一题,在上半节比赛中,以31881收盘,在第一次休息前的比赛环节沃森只答错一题,表现好过昨天很多。
据IBM中国研究院-张雷(新浪微博ID)发布的信息显示,今天最后一段是做Final Jeopardy的题目。比赛时,主持人只说出Final Jeopardy的题目类型,但不说出具体题目。今天,题目类型是:美国的城市——“Its largest airport is named for a World War II hero, its second largest for a World War II battle. (这座城市的最大的机场是以二战的一个英雄命名的,而它的第二大机场是以二战的一场战役命名的)”
和一般题目不同,对于Final Jeopardy的题目,选手有3分钟的时间进行思考。然后每个人在自己的题板上写上答案。然后选手们要仅仅根据题目类型和当时赛场形式,赌一个分数。沃森因为遥遥领先,所以只赌了很小的一个数,几百块而已。
可惜的是沃森在最后一题搞混了芝加哥和多伦多两个城市。不过由于Watson下的赌注很小,只失去了几百美元。
随后比赛又进行了一段,在最终半个小时结束后,今天的比赛结果是:Ken $4800, Brad $10400, 沃森 $35734,显然在这一轮比赛中,沃森以较大优势遥遥领先。
昨天和今天的三轮比赛一起是一场完整的比赛;明天将进行第二场比赛,并且三轮比赛一次全部进行。两场比赛各选手的得分加起来决定胜负。
———人类选手反馈———
人类选手Ken昨天提到,考虑到沃森拥有的强大的知识库。在比赛中,他们会采用更激进的策略来进行抢答。
人类选手Ken同时提到,他们觉得沃森要花些时间来习惯一个新类别的问题。所以他们要选择从每类中高分值的题开始抢答。
Watson参与《危险边缘》智力竞答比赛的详细情况可参见首日报道:《Watson首日参加<危险边缘>:人机僵持中》
另请参阅:《IBM中国研究院专家:15年后沃森与深蓝不同》
昨日复盘:《人机大战复盘:Watson首日《危险边缘》战况》
———微问答———
网友QuanYuan007:"为什么Watson有一次置信度为32%抢答了,有一次为36%却没有去抢答,求解。谢谢"。
IBM 中国研究院-张雷:沃森会根据比赛现场的形势不断调整其比赛策略,所以置信度阈值会变化。当非常领先时,沃森可能会变得保守,对于低置信度的题目就不抢答了。 当策略比较激进时则相反。
QuanYuan007:哦,原来改了,记得最早的策略是低于50%就不答。我记得答32%这次,watson分数已经过2万了,优势不小了。呵呵,比较好奇这个 threshold怎么设的,是固定的,还是learn的。
网友好奇的树:英文要足够好才能看的到精彩?好奇问一句?敢问沃兄对中文是否也可以做到“披文入里,深得堂奥”?
IBM 中国研究院-张雷:沃森现在尚不能处理中文。更别提古文和文言文了。所以还有提高的空间 :)
网友偶是雨也是R:突然想起来。昨天曾经讨论说沃森并没有ASR技术,那他到底是如何“听题”的?因为抢答是主持人念完题目后一秒开始的,沃森不“听题”怎么知道抢答开始了?
IBM中国研究院-滕晓菲:沃森通过电子文本字符来接收与观众以及选手看到的信息。
偶是雨也是R 回复IBM 中国研究院-滕晓菲: 恩。我可以理解它靠文本收题啦。但是他怎么知道抢答开始?也就是什么时候可以按下抢答键呢?
网友LeonFeng:问个问题,比赛的时候,电脑选手是否还插着网线或用无线联着网络?
IBM中国研究院-滕晓菲:是单机,没有互联网连接的。