NOI2024题目知识构成分析报告2024-11-14 17:30:02阅读量:4
【摘要】本报告分析了第 41 届全国青少年信息学奥林匹克竞赛的知识整体分布,以及各题目的主要知识点、能力要求和难度设置等。本次竞赛所考察的知识范围较为广泛,难度设置符合NOI大纲的建议。此外,竞赛延续了近年来侧重考察思维能力的发展趋势。
第41届全国青少年信息学奥林匹克竞赛(NOI2024)于2024年7月21日在重庆圆满闭幕。本次竞赛的金牌分数线为538分,银牌分数线为409分,铜牌分数线为314分。本报告将从《全国青少年信息学奥林匹克系列竞赛大纲》(NOI大纲)出发,对NOI2024的全部六道机试题目进行分析。对每道题目,报告将详细分析题目所考察的主要知识点、难度系数设置,以及题目设计对选手的能力要求等,最后对题目的知识构成做出总体性评价。
NOI2024 共包括两试 6道题目。其中,
l 第一试题目依次为:集合(set)、百万富翁(richest)、树的定向(tree);
l 第二试题目依次为:分数(fraction)、登山(mountain)、树形图(graphee)。
全部题目所涉及的主要知识点统计如下:
表1 NOI2024 题目所涉及的主要知识点
序号 | 知识点 | 级别 | 板块 | 编号 | 难度 |
1 | 队列 | 入门 | 数据结构 | 2.1.3.1-3 | 3 |
2 | 树的定义与相关概念 | 入门 | 数据结构 | 2.1.3.2-1 | 3 |
3 | 枚举法 | 入门 | 算法 | 2.1.4.2-1 | 1 |
4 | 贪心法 | 入门 | 算法 | 2.1.4.3-1 | 3 |
5 | 递推法 | 入门 | 算法 | 2.1.4.3-3 | 3 |
6 | 递归法 | 入门 | 算法 | 2.1.4.3-3 | 4 |
7 | 二分法 | 入门 | 算法 | 2.1.4.3-4 | 4 |
8 | 深度优先搜索 | 入门 | 算法 | 2.1.4.6-1 | 5 |
9 | 广度优先搜索 | 入门 | 算法 | 2.1.4.6-2 | 5 |
10 | 简单背包类型动态规划 | 入门 | 算法 | 2.1.4.8-3 | 5 |
11 | 排列 | 入门 | 数学与其他 | 2.1.5.4-4 | 4 |
12 | 映射(map)、多重映射(multimap) | 提高 | C++程序设计 | 2.2.2.2-5 | 5 |
13 | 并查集 | 提高 | 数据结构 | 2.2.3.2-1 | 6 |
14 | 树状数组 | 提高 | 数据结构 | 2.2.3.3-1 | 6 |
15 | 线段树 | 提高 | 数据结构 | 2.2.3.3-3 | 6 |
16 | 数值哈希函数构造 | 提高 | 数据结构 | 2.2.3.5-1 | 5 |
17 | 搜索的剪枝优化 | 提高 | 算法 | 2.2.4.6-1 | 6 |
18 | 树上倍增 | 提高 | 算法 | 2.2.4.7-12 | 6 |
19 | 强连通分量 | 提高 | 算法 | 2.2.4.7-9 | 7 |
20 | 树型动态规划 | 提高 | 算法 | 2.2.4.8-1 | 6 |
21 | 动态规划的常用优化 | 提高 | 算法 | 2.2.4.8-3 | 8 |
22 | 树链剖分 | NOI | 数据结构 | 2.3.2.3-1 | 8 |
23 | k-d树 | NOI | 数据结构 | 2.3.2.3-1 | 9 |
24 | 离线处理思想 | NOI | 算法 | 2.3.3.1-2 | 8 |
主要知识点的学习难度系数分布统计如下:
图1 知识点难度系数统计直方图
主要知识点的板块分布统计如下:
图2 知识点板块统计直方图
总体上看,NOI2024 所考察的主要知识点分布较广,在“级别”上以“入门级”和“提高级”知识点居多,在“难度”上以 6 级知识点最多,而在“板块”上则以“算法”知识点最多。主要知识点的学习难度系数,范围为从 1 到 9,与大纲的建议考察范围完全一致。
以下为每道题的知识构成详细分析。
1 集合(set)
本题是整套题目中较为简单的一道题,预期大多数NOI选手都能得到 80 分以上。最后 20 分涉及到集合哈希,对于高水平选手也具有一定的区分度。
本题的部分分设置充足,只要选手能够正确实现暴力枚举,就可以获得40分;如果选手能够观察到答案的单调性,用双指针维护,就可以得到 60 分左右。
本题正解所考察的知识点主要包括队列、集合哈希。其中,“集合哈希”属于“提高级”的“数据结构”,大纲标注学习难度系数为5。所涉知识点难度均不超过大纲规定NOI考试所要求的难度。
1.1 难度设置
本题的部分分所考察的知识点具体包括:
部分分描述 | 分值 | 涉及知识点 |
1~8 | 40 | 2.1.4.2-1【1】枚举法 |
9~12 | 20 | 2.1.3.1-3【3】队列 |
13~20 | 40 | 2.1.5.4-4【4】排列 2.2.3.5-1【5】数值哈希函数构造 |
本题的“知识点难度系数—可得分数”关系见下图(横轴为知识点难度系数,纵轴为不超过该难度的可得分数):
图3 “集合”的难度设置曲线
1.2 总体评价
本题所考察的知识点的最高难度系数为5级,与大纲关于NOI题目知识点难度的建议相一致,也符合D1T1的应有难度。本题的“知识点难度系数—可得分数”曲线较为平缓,说明部分分设置合理。
2 百万富翁(richest)
本题是NOI比赛中的中等难度题目,本题要求选手需要具备一定的模型转化能力和问题洞察能力,能够想到把大规模的问题逐层递归,变为更小规模的子问题进行解决。
当一个元素在某条边上的询问结果表明它较小,则该元素可以被排除。选手可以利用一次询问,将当前未排除的元素两两分成一组,用一次询问同时比较,从而排除掉一半的元素。这是二分的思路。
另一种立即的思路是通过一次询问,将所有未排除的元素放入一个大组,在组内两两比较,直接确定出最大元素。若选手始终采用方法1,则可在20次询问下获得26分。若选手先应用几次方法1,再进行一次方法2询问,则可以在13次询问下获得52分。13次询问这一临界点可以通过计算贪心得到。
更高得分的关键在于发现一个介于上述两种思路之间的策略:选手可以将未排除的元素分成若干个组,每组包含大于两个元素,但不覆盖所有元素。每次递归中分成的组数成为待优化的参数,选手需要探索合适的分组方式,以最小的询问次数达到最佳效果。
本题的考查重点在于选定一条好的递归路径。由于不同递归方式所消耗的询问个数不同,在严苛的询问个数限制下,选手需要使用动态规划直接计算出最优的递归方案,或者凭借数学直觉拟定一种优秀的递归方案。
本题要求选手需要具备一定的模型转化能力和问题洞察能力,能够从问题本身出发设计出合理的状态。事实上,如果选手拥有较强的数学建模能力以及关于无向图独立集方面的知识,不仅可以设计出优秀的DP方案,而且可以根据DP结果证明题目给出的界是严格最优的。
本题正解所考察的知识点主要包括简单背包类型动态规划、用决策单调性对动态规划进行优化。其中决策单调性属于动态规划的常用优化,大纲标注学习难度系数为8,所涉知识点难度均不超过大纲规定NOI考试所要求的难度。
2.1 难度设置
本题的部分分所考察的知识点具体包括:
部分分描述 | 分值 | 涉及知识点 |
1 | 15 | 2.1.4.2-1【1】枚举法 |
2 | 11 | 2.1.4.3-4【4】二分法 |
2 | 26 | 2.1.4.3-1【3】贪心法 |
2 | 26 | 2.1.4.3-3【4】递归法 |
2 | 13 | 2.1.4.8-3【5】简单背包类型动态规划 |
2 | 9 | 2.2.4.8-3【8】动态规划的常用优化[1] |
本题的“知识点难度系数—可得分数”关系见下图(横轴为知识点难度系数,纵轴为不超过该难度的可得分数):
图4 “百万富翁”的难度设置曲线
2.2 总体评价
本题所考察的知识点在大纲中不超过8级,符合大纲对于NOI试题难度的预设。只要选手掌握枚举、二分、贪心等基本算法思想,直接使用这些思想即可得到一个15~52分的做法。如果选手能够想到递归的思路,并且设计出一条优秀的递归路径以后,通过手算或稍劣的DP即可得到78以上的分数。
3 树的定向(tree)
本题难度较大,要求选手具备对多个知识点的综合掌握和灵活运用能力。本题标准算法的实现细节比较复杂,代码规模在 4KB 左右,因此对选手的代码实现能力要求较高。
本题需要选手首先对题目进行模型转化,推导出充要条件。在得到充要条件以后,使用队列进行维护,得到一个初步的算法。选手想要获得更高的分数,需要利用数据结构对转化后的算法进行维护。
本题正解所考察的知识点主要包括倍增法、并查集。其中,倍增法、并查集均属于提高级数据结构,大纲标注学习难度系数为6。
本题的正确做法很多。如果选手利用其他的数据结构知识,也很容易想出别的正确或复杂度稍劣的做法,例如启发式合并,线段树,树链剖分,在树边上随机设置报警器,或者使用k-d tree对非树边进行维护等等,都可以通过此题,或者获得至少72分的部分分。
综合来看,本题所涉知识点难度均不超过大纲规定NOI级比赛所要求的难度。
3.1 难度设置
本题的部分分所考察的知识点具体包括:
部分分描述 | 分值 | 涉及知识点 |
1~3 | 12 | 2.1.3.2-1【3】树的定义与相关概念 |
4~6 | 20 | 2.1.4.3-1【3】贪心法 |
9,10,15,16 | 16 | 2.1.4.6-1【5】深度优先搜索 |
11~14 | 16 | 2.1.3.1-3【3】队列 2.1.4.3-3【3】递推法 |
17,18 | 8 | 2.3.2.3-1【9】k-d树 |
19~21 | 12 | 2.3.2.3-1【8】树链剖分 2.2.3.3-3【6】线段树 |
22~25 | 16 | 2.2.4.7-12【6】树上倍增 2.2.3.2-1【6】并查集 |
本题的“知识点难度系数—可得分数”关系见下图(横轴为知识点难度系数,纵轴为不超过该难度的可得分数):
图5 “树的定向”的难度设置曲线
3.2 总体评价
本题所考察的知识点在大纲中不超过9级,符合大纲对于NOI试题难度的预设。本题的部分分难度设置合理。
4 分数(fraction)
本题难度较低,主要考察选手对搜索优化的深入理解和灵活应用。本题部分分设置充足,对选手代码实现能力的要求较低,绝大多数选手都能得到80分以上的成绩,但获得满分极为困难。
本题正解考查的知识点主要包括广度优先搜索和搜索的剪枝优化。其中“广度优先搜索”属于“入门级”的“搜索算法”,大纲标注学习难度系数为5;“搜索的剪枝优化”属于“提高级”的“搜索算法”,大纲标注学习难度系数为 6。所涉知识点难度均不超过大纲规定NOI考试要求的难度。
4.1 难度设置
本题的部分分考查的知识点如下表所示。
部分分描述 | 分值 | 涉及知识点 |
1~3 | 15 | 2.1.4.6-2【5】广度优先搜索 |
4~6 | 15 | 2.1.4.6-2【5】广度优先搜索 |
7~10 | 20 | 2.1.4.6-2【5】广度优先搜索 |
11~14 | 15 | 2.1.4.6-2【5】广度优先搜索 |
15~17 | 15 | 2.1.4.6-1【5】深度优先搜索 2.2.4.6-1【6】搜索的剪枝优化 |
18 | 5 | 2.1.4.6-1【5】深度优先搜索 2.2.4.6-1【6】搜索的剪枝优化 |
19 | 5 | 2.1.4.6-1【5】深度优先搜索 2.2.4.6-1【6】搜索的剪枝优化 |
20 | 5 | 2.1.4.6-1【5】深度优先搜索 2.2.4.6-1【6】搜索的剪枝优化 |
本题的“知识点难度系数—可得分数”关系见下图,横轴为知识点难度系数,纵轴为不超过该难度的可得分数)。
图6 “分数”的难度设置曲线
4.2 总体评价
本题考查的知识点的最高难度系数为6,与大纲建议的 NOI题目知识点难度相一致。本题考查的最难知识点为搜索的剪枝优化,在大多数选手的掌握范围内,但选手必须对特定问题进行深入分析,才能设计出优秀的剪枝策略和较好的算法。采取不同剪枝策略和不同时间复杂度的搜索算法,可以分别取得 70、85、90、95、100等分数,阶梯设置基本平滑,说明本题的部分分设置比较合理。
5 登山(mountain)
本题是属于中等难度,且解法多样。本题主要考察选手对动态规划以及使用数据结构对动态规划进行优化的深入理解和灵活运用能力。本题的部分分设置充足,即使选手并未充分掌握使用数据结构对动态规划进行优化,结合题目所给特殊性质,也应能得到65分左右。
本题正解所考察的知识点主要包括树型动态规划、动态规划的常用优化、线段树。其中“树型动态规划”属于“提高级”的“动态规划”,大纲标注学习难度系数为6;“动态规划的常用优化”属于“提高级”的“动态规划”,大纲标注学习难度系数为8;“线段树”属于“提高级”的“特殊树”,大纲标注学习难度系数为6。除线段树外,本题还有许多使用“树状数组”和“树链剖分”、“映射(map)、多重映射(multimap)”和“离线处理思想”等对树型动态规划进行优化的优秀做法,其中“树状数组”属于“提高级”的“特殊树”,大纲标注学习难度系数为6;“树链剖分”属于“NOI级”的“复杂树”,大纲标注学习难度系数为8;“映射(map)、多重映射(multimap)”属于“提高级”的“STL模板”,大纲标注学习难度系数为5;“离线处理思想”属于“NOI级”的“算法策略”,大纲标注学习难度系数为8。所涉及的知识点难度均不超过大纲规定的NOI考试所要求的难度。
5.1 难度设置
本题的部分分所考察的知识点具体包括:
部分分描述 | 分值 | 涉及知识点 |
1 | 5 | 2.2.4.8-1【6】树型动态规划 |
2∼3 | 10 | 2.2.4.8-1【6】树型动态规划 |
4∼5 | 10 | 2.2.4.8-1【6】树型动态规划 |
6 | 5 | 2.2.4.8-1【6】树型动态规划 2.2.4.8-3【8】动态规划的常用优化 |
7 | 5 | 2.2.4.8-1【6】树型动态规划 2.2.4.8-3【8】动态规划的常用优化 |
8 | 5 | 2.2.4.8-1【6】树型动态规划 2.2.4.8-3【8】动态规划的常用优化 |
9 | 5 | 2.2.4.8-1【6】树型动态规划 2.2.4.8-3【8】动态规划的常用优化 |
10 | 5 | 2.2.4.8-1【6】树型动态规划 2.2.4.8-3【8】动态规划的常用优化 |
11∼12 | 10 | 2.2.4.8-1【6】树型动态规划 2.2.4.8-3【8】动态规划的常用优化 |
13 | 5 | 2.2.4.8-1【6】树型动态规划 2.2.4.8-3【8】动态规划的常用优化 |
14∼20 | 35 | 2.2.4.8-1【6】树型动态规划 2.2.4.8-3【8】动态规划的常用优化 2.2.3.3-3【6】线段树 或 2.2.4.8-1【6】树型动态规划 2.2.4.8-3【8】动态规划的常用优化 2.2.3.3-1【6】树状数组 2.3.2.8-1【8】树链剖分 或 2.2.4.8-1【6】树型动态规划 2.2.4.8-3【8】动态规划的常用优化 2.2.2.2-5【5】映射(map)、多重映射(multimap)2.3.3.1-2【8】离线处理思想 |
本题的“知识点难度系数—可得分数”关系见下图(横轴为知识点难度系数,纵轴为不超过该难度的可得分数):
图7 “登山”的难度设置曲线
5.2 总体评价
本题正解的知识点最高难度系数为8级,与大纲关于NOI题目知识点难度的建议相一致,符合D2T2的应有难度。
本题在部分分设置上有一定坡度,难度设置总体上比较合理,基本符合大纲对于NOI试题难度的预设。本题考察的主要知识点为“树型动态规划”和“动态规划的常用优化”,在此基础上,选手可灵活选用“线段树”、“树状数组”、“映射(map)、多重映射(multimap)”、“离线处理思想”等方式方法完成题目,减少了失分的偶然性。
6 树形图(graphee)
本题难度较高,绝大部分选手只能获得较低的部分分。本题要求选手掌握若干图论基础知识,并具有较高的综合运用能力,观察并证明性质的能力。同时本题代码规模较大,对选手代码实现能力有较高要求。
本题正解考查的知识点主要包括图论中的深度优先搜索和强连通分量。其中“深度优先搜索”属于“入门级”的“搜索算法”,大纲标注学习难度系数为 5;“强连通分量”属于“提高级”的“图论算法”,大纲标注学习难度系数为7。本题需要观察出图中路径的性质,同时通过对DFS树和强连通分量的复杂操作解决问题。综合来看,所涉知识点难度均不超过大纲规定NOI考试要求的难度。
6.1 难度设置
本题的部分分考查的知识点如下表所示。
部分分描述 | 分值 | 涉及知识点 |
1 | 5 | 2.1.4.6-1【5】深度优先搜索 |
2 | 5 | 2.2.4.7-9【7】强连通分量 |
3~4 | 10 | 2.1.4.6-1【5】深度优先搜索 |
5~6 | 10 | 2.1.4.6-1【5】深度优先搜索 2.2.4.7-9【7】强连通分量 |
7 | 5 | 2.1.4.6-1【5】深度优先搜索 2.2.4.7-9【7】强连通分量 |
8~9 | 10 | 2.1.4.6-1【5】深度优先搜索 2.2.4.7-9【7】强连通分量 |
10~13 | 20 | 2.1.4.6-1【5】深度优先搜索 2.2.4.7-9【7】强连通分量 |
14~15 | 10 | 2.1.4.6-1【5】深度优先搜索 2.2.4.7-9【7】强连通分量 |
16~20 | 25 | 2.1.4.6-1【5】深度优先搜索 2.2.4.7-9【7】强连通分量 |
本题的“知识点难度系数—可得分数”关系见下图,横轴为知识点难度系数,纵轴为不超过该难度的可得分数)。
图8 “树形图”的难度设置曲线
6.2 总体评价
本题考查的知识点的最高难度系数为7,与大纲建议的 NOI题目知识点难度相一致。本题考查的最难知识点为强连通分量,也考察了深度优先搜索的拓展运用—DFS树,在大多数选手的掌握范围内。但题目是对选手实力的综合考验,必须对问题进行深入分析,通过部分分逐步发现若干图上的性质,已经要求选手兼具日常积累和洞察力。同时选手需要设计出综合的图论算法,并具备编写复杂算法的代码能力。本题的部分分设置比较合理,能体现选手在此题达到的思维深度。综上所述,本题作为D2T3质量较高。
注【1】:可以使用图的独立集知识完成有关的严格证明,但这并非解题所必须掌握的知识。在NOI大纲中,“图的独立集”的级别为NOI级,编号为2.3.3.3-5,难度系数为10。
报告执笔人:
| 金 靖 华东师范大学第二附属中学 |
叶金毅 中国人民大学附属中学 | |
杨耀良 清华大学 | |
叶李蹊 中国人民大学附属中学 | |
潘玉斌 西南大学附属中学校 | |
谷多玉 中国人民大学附属中学 | |
陈许旻 成都市锦江区嘉祥外国语高级中学 | |
梁 霄 中国人民大学附属中学 | |
赵启阳 北京航空航天大学 | |
韩文弢 清华大学 |