转载:数模问答:MCM/ICM选题策略及参赛建议

时间:2018年11月27日作者:amao查看次数:166,783 次评论次数:0

本文转自“数模Club”,经原作者授权转载。
原文链接:http://shumo.club/home/posts/xuan-ti.html
微信公众号文章链接:https://mp.weixin.qq.com/s/WWQftFFZ93eJeL_hT_c82w

2017年数学建模美赛公布题型,ABCDEF六种,A连续 B离散 C数据见解 D运筹学/网络科学 E环境科学 F政策 应该着重学习哪几个题型?应该怎么学习才能获M奖呢?队内两只小白一只有点经验,都是计算机

原问题链接:https://www.zhihu.com/question/51699663

这一句话问了三个问题,先讲结论再解释:

  • 所谓6种题型,提示了部分题目的内容,但如果作为选题依据,作用非常有限。如果是为了更好的选题,搞清楚MCM与ICM的区别,可能更有帮助。
  • 选哪道题不是特别重要,重要的是应该“尽快”选题。竞赛时间是固定的,选题的时间越长,做题的时间越少。选题多花1小时,意味着建模和写论文的时间就少了1小时。
  • 能获什么奖主要看实力,其次看运气。准备越充分,胜算越大。如果不想碰运气的话,早点动手准备吧。
六种题型怎么理解

首先,MCM/ICM(2016年起)每年共有6道题,不是6种题,MCM是ABC三题,ICM是DEF三题。对6道题目类型的描述,不是严格的划分,角度和依据都不相同。

continuous和discrete是指模型的类型,data insights是指问题数据的特征,operations research/network science和environmental science是指问题涉及到的学科,而environmental science和policy又是指问题本身的背景。这不是按照同一标准对题目进行划分,之间有重叠。最显然的,如果认为continuous和discrete是互补的,那么其他4道题目应该可以分别归入其中某一类。

其次,这些一两个词的描述过于笼统、宽泛,无法体现题目的具体特征,特别是A、B、F题的描述,提供的信息非常少,说了几乎等于没说。continuous、discrete把所有的模型全包括了。policy范围也太广,人类主宰世界,方方面面都可能涉及政策问题。而且F题也是2016年新增加的,只有2016年一年的题目(难民问题),暂时还看不出来什么规律。

而C题和D题的特征相对具体一些。比如,针对2016年起MCM新增加的C题,COMAP(Consortium for Mathematics and Its Applications)专门发布了一份 文档 ( 中文简介 )说明其特征。概括起来,MCM的C题与数据有关,虽然称不上大数据,但压缩包也在100MB以上,与MCM/ICM其他题目相比,数据量算是大的(实际上以往MCM/ICM的题目很少给数据),这就要求选这一题的参赛队要熟悉数据处理的基本方法,包括预处理、后处理等,并掌握相应的编程技能或是相关软件的使用方法。模型、方法方面,可能主要集中在统计、模式识别等方向。再比如D题如果是网络科学的问题的话,所用到模型、算法、软件比较集中,有章可循。近几年网络科学是一个热门研究领域,算法、软件包括可视化的软件都很多,如果对这一领域的相关知识和软件都比较熟悉,选题时可以重点关注D题。

E题环境科学,大体上会集中在环境污染、资源短缺、可持续发展、生态保护等几个方面。对问题的背景有一定的提示作用,但是范围仍然很广,模型、方法没有明显的特征。

所以,显然无法仅仅根据这些提示就进行选题,至多是,排除某个题目不考虑(如,计算能力差的队可以不选C题)。如果仅从选题的角度出发,搞清楚MCM竞赛与ICM竞赛的区别,可能更有帮助。

MCM与ICM的区别

国内常说的美国赛,其实是两个竞赛,MCM即Mathematical Contest in Modeling,直译为数学建模竞赛,和ICM即The Interdisciplinary Contest in Modeling,直译为交叉学科建模竞赛。因为两者均由COMAP主办,共用同一套报名系统,竞赛时间完全一致,同时发题,同时收卷,交卷地址和邮箱相同,同时公布成绩,证书相似,这些形式上的共同点,使一部分参赛队忽视了两者间的差异。

  • MCM是1985年开赛,而ICM是1999年才开始第一届。这也是AB两题分别是continuous和discrete的原因,因为开始的时候只有MCM竞赛,这样划分有一定道理。
  • 两者名称不同,题目的风格有较大的差异。一般MCM竞赛题目较具体,表述简洁,要求明确,ICM竞赛题目更开放,问题更“大”,更宏观,篇幅较长,往往是全球范围内共同关心的问题,因此一般不依赖特定的文化背景或生活习惯。而MCM的题目中则有相当一部分是以美国生活为背景,其他国家特别是中国参赛者不熟悉。这一点在后面还会讲到。
  • 两者虽然均由COMAP主办,但是COMAP只负责宣传、报名、出版等公共事务,而命题、评审等工作均由各自的组委会负责,两个竞赛从主席到评委都不相同,只有个别专家两个竞赛的活动都参加。根据最新的 2017 MCM/ICM Flyer ,两者组委会的构成不完全相同。MCM设Contest Director、Executive Director、Associate Director、Founding Director和Advisory Board。ICM设Contest Director、Executive Director、Associate Director和Head Judges。以上职务中两者只有Executive Director是相同的,均为COMAP总裁Solomon A. Garfunkel先生,其他没有重叠。据此推断,两个竞赛的命题、评审等工作应该是各自独立进行,因此两者在题目风格、评审尺度、取奖比例等方面均有差别。
  • 两个竞赛参赛队数和构成不同,奖项比例也不一样。根据COMAP公布的 报告 ,2016年MCM有7421支队伍参赛,其中美国参赛队389支,其他7032支队伍主要来自中国,评出Outstanding 13个(约0.18%),Finalist 22个(约0.3%),Meritorious 594个(约8%),Honorable Mention 2604个(约35%);而2016年ICM有5025支队伍参赛,其中美国参赛队91支,评出各奖项的个数分别为14、15、935、2287,相应比例约为0.28%、0.30%、18.6%、45.5%。简单的说有这么几个特点,MCM/ICM竞赛主要是中国的参赛队,美国的队伍主要参加MCM,而ICM的评奖比例更高一些。有人整理了2012年之前的竞赛数据,并做了详细地分析,有兴趣的朋友可以看一下这篇文章: 美国大学生数学建模竞赛数据及评阅分析 。
  • 同样根据上面这篇文章中的数据,两个竞赛每年的取奖比例并不是一个固定的数值,有一定的波动。有可能是确定一个大致的比例,再根据当年论文的质量,确定获奖论文。两个竞赛也可能因为组委会成员不同,具体的操作方式也不一样。
  • 近几年ICM竞赛要求论文正文部分不超过20页,而MCM没有类似要求。这对母语非英语的参赛者来说,有一定影响。

综合以上两点,赛前可以根据题目的特点,有针对性的做一些准备工作,根据自己队伍的实际情况,大致确定参加哪一个竞赛即可,不需要,也没办法确定具体选哪个题目,选题只能在拿到题目之后进行。

如何选题

拿到题目之后,选题时可以考虑以下几个因素。

  • 尽快选题。无论选哪个题,都要快。竞赛时间短,每一分钟都很宝贵,花费在选题环节上的时间越多,留给后续环节的时间就越少。即使省出来的时间用来睡觉,也能提高效率。很多队伍前松后紧,拿到题目犹犹豫豫,左右摇摆,几个小时都不能确定选题。而到了最后,论文写不完,或者写完了没时间加工修改。在选题环节花费大量的时间是很不划算的。
  • 扬长避短。任何一个参赛队,应该对自己的实力和特长有准确的认识和把握。选择最熟悉,最有把握,最有想法的题目,回避自身弱项。比如,计算能力差的队一般不要选择需要大量编制的题目,收集整理资料能力弱的队不选那些需要查找大量数据的题目,等等。
  • 国情、文化背景。MCM/ICM中不少题目是以美国生活为背景的,很多背景知识对于中国学生来说,非常陌生。MCM2006B题要解决机场的轮椅安排问题(Wheel Chair Access at Airports),而在中国的机场,很少有航空公司会为乘客准备轮椅,这个问题在中国几乎是不存在的。可能很多中国学生拿到题目之后,第一个疑问是,为什么机场会有轮椅?MCM2009A题要求设计交通环岛的信号灯(Designing a Trafficf Circle),题目中提到stop sign和yield sign。中国的交通法规中没有这两个标志,绝大多数中国学生不知道这两个标志的含义。但是对美国学生来说这是常识。MCM2010A题是关于棒球棍上最佳击球点的问题,中国学生打过棒球的应该不太多。MCM2013A题要求设计更好的烤盘(The Ultimate Brownie Pan)。烤箱在美国是最常见的厨房电器,即使是用于出租的公寓,烤箱和灶、油烟机、冰箱是最基本的配套设施。但是在中国,直到最近几年才有部分大中城市的个别家庭开始购置烤箱。中国学生对烤箱、烤盘、烘烤过程完全没有概念。类似的情况还有MCM2002B题机票超订问题(Airline Overbooking),MCM2004B题快速通道系统(A Faster QuickPass System),MCM2005B题收费站设计问题(Tollbooths),MCM2007A题选区划分问题(Gerrymandering),ICM2008C题医保系统问题(Finding the Good in Health Care Systems),MCM2014B题教练排名问题(College Coaching Legends),ICM2016F题难民问题(Modeling Refugee Immigration Policies)等等。虽然这些知识都不是秘密,可以查到相关的资料,但是中国学生需要花费几个小时才能搞清楚美国学生从小到大都知道的常识。如果理解不准确,还有可能影响最终的方案。选题的时候要考虑这一因素的影响。
如何备战

数学建模竞赛自身的特点决定了评奖有一定的偶然性,最终的奖项主要由实力决定,但不完全由实力决定,运气也有很大影响。两者大体上是七三开,或者八二开,偶然因素大概会影响半个或一个奖励等级,不会到两个等级。也就是说,一个实力大致能拿H的队,运气好一点,或许可以拿到M,但怎么都不可能冲击F或者O。而对于O或者F这样高等级的奖励,偶然因素的影响可能更大一些。也就是说,有把握拿M的队,都有机会争取F或者O。讲的夸张一点,就算命题人组一个队亲自上阵,虽然M肯定是有把握的,但也不能保证一定能拿O。

运气可遇而不可求,所以只能通过提高自身实力来提高获奖的可能性。所谓建模实力,大致可以分为模型储备、计算能力和写作水平三个主要方面。

模型储备

模型储备主要是指参赛队的数学基础,对常见模型、方法的理解,以及灵活运用这些知识的熟练程度。熟练掌握的模型越多,解决问题时的眼界越开阔,可选择的方法也越多。常见的模型和方法在主要的数学建模教材,或各种开放课程中都有介绍,每个参赛队都应该掌握以下这些内容:

  • 微积分
  • 线性代数
  • 概率论与数理统计
  • 规划模型
  • 微分方程模型
  • 图论模型
  • 计算机仿真方法

再扩展一点,可以了解以下内容:

  • 博弈论模型
  • 微观经济学基本原理
  • 元胞自动机模型
  • 群体决策模型
  • 智能计算(遗传算法、模拟退火算法、蚁群算法等)
  • 基本的数字图像处理方法
  • 常见的模式识别算法(聚类算法、神经网络、支撑向量机等)

这个列表可以一直写下去,但是有了这些模型的储备,粗略估计可以应对80%以上的问题。

特别注意,时间有限,精力有限,短时间内不可能精通所有的模型和算法,基本模型要熟练,扩展方法可以先掌握思想、原理,适应的场合,应用的条件,优缺点等基本信息,再了解细节。

计算能力

数学建模竞赛对计算能力的要求,与ACM的ICPC程序设计竞赛的要求不一样,范围更广,不只是编程。程序设计竞赛的高手,不见得能够完成数模竞赛中的计算任务。数学建模竞赛所需的计算机技能大体如下:

  • 文献检索,数据收集(搜索引擎,数据库)
  • 编程能力
    • 至少能够熟练使用一种高级语言
    • 常见的数值计算方法
    • 常用的图论算法
    • 文本文件读取、处理
    • 数字图像(基本概念,读取,简单加工)
  • 常用图表绘制
  • 参考文献管理
  • 科技论文排版(规范,软件)
  • 文本文件编辑器(*)
  • 正则表达式(*)
  • 版本控制(*)

注:加*项目为可选项

论文写作

写作是数模竞赛中最关键的一步,因为竞赛的作品就是论文,三个人几天的劳动成果都要在论文中体现。没写出来,写不出来,或者没有恰当的写出来都会影响竞赛成绩。

对于美国赛而言,论文写作水平是指两个方面,一是会不会写科技论文,二是英文表达能力如何,也就是会不会用英文写。如果模型做的不好,自然写不出来好论文,但是更普遍的现象是,模型做的不错,但是没写好,最后成绩很差。

写作是个大话题,一两句话说不清楚,这里推荐一本书 《正确写作美国大学生数学建模竞赛论文》 ,这是 美国大学生数学建模竞赛指导丛书 中的一本,是由COMAP与高等教育出版社联合策划出版的,好象也是市场上唯一一本专门针对数学建模竞赛论文写作的参考书。看完这本就差不多了。

除了这本书,往年的优秀论文也是必须要看的,而且要认真看,认真研究。

当然,只看书和优秀论文是无法提高写作水平的,一定要自己动手写。写完与优秀论文对比,或者请老师点评,再修改,逐步提高。

时间安排

上面所说的这些能力,不是一两天能够练成的,要有一个漫长、艰辛的过程,有计划地实现。竞赛前的准备工作大体可以分为三个阶段:

  1. 学习数学建模课程。这一阶段主要解决模型储备问题。同时,在学习的过程中,通过不断的练习,逐步提高计算能力和写作水平。可以选修所在学校的课程,也可以通过网上的开放课程完成。
  2. 赛前培训。这一阶段主要是了解竞赛要求,熟悉往年赛题,研读优秀论文。第一个阶段的学习所获得的知识和能力,不是针对特定竞赛的,是普遍适用的。而这一阶段的培训非常有针对性。
  3. 模拟赛。所谓模拟赛,就是选择难度相当的题目,严格按照竞赛时间要求(包括起始的时刻)进行,写出完整的论文。模拟赛后,一定要分析论文,可以请有经验的老师点评,也可以自行对照检查。只有分析出论文的优缺点,才能改进提高。这是检验自身实力的最好方法。至少要进行一次,有条件的话,两次以上效果更好。如果之前没有参加过类似竞赛,又不进行模拟赛,直接参赛的话,时间就是一个大问题,这样参赛队很有可能无法在竞赛指定的时间内完成题目要求的各项任务。
总结

如果上面讲的这些都能做到,M奖就不远了。但是最后还要讲一点,数模竞赛是手段,不是目的。奖项虽然重要,也可以以奖项论英雄,但是不要仅以奖项论英雄,关键是要看参赛的整个过程中,是否有收获。如果说获奖就有收获,没获奖就没收获,时间、精力就白费了,那么这个竞赛就是失败的,也不是竞赛的初衷。无论获奖与否,要看整个过程中建模能力是不是提高了,计算能力是不是提高了,写作水平是不是提高了,这些才是真正的收获。

对于认真准备,积极备战的参赛队,不能保证他们一定能获奖,H奖都不能保证,但是可以保证他们一定有收获。

声明: 本文采用 BY-NC-SA 协议进行授权 | 数学建模网—SHUMO.COM
转载请注明转自《转载:数模问答:MCM/ICM选题策略及参赛建议

分类:MCM/ICM
0条评论

暂时没有评论!

发表评论

*

*

注意: 评论者允许使用'@user空格'的方式将自己的评论通知另外评论者。例如, ABC是本文的评论者之一,则使用'@ABC '(不包括单引号)将会自动将您的评论发送给ABC。使用'@all ',将会将评论发送给之前所有其它评论者。请务必注意user必须和评论者名相匹配(大小写一致)。