大数据分析中的算法 (2019年春季)

  • 本课程考核包括平时作业和程序,期中大项目,期末大项目,请谨慎选课

  • 课程代码:00136720 (本科生),00100863 (本研合)

  • 课程内容: 侧重数据分析中的数值代数和最优化算法

  • 教师信息: 文再文,wenzw at pku dot edu dot cn

  • 助教信息: 刘浩洋: liuhaoyang at pku dot edu dot cn , 柳昊明: haomingliu at pku dot edu dot cn

  • 课程微信群(下面二维码2月24日失效)

150px 
  • 作业和课程项目,重要日期和提交内容:

  • 课程项目

    • 课程项目二: 请见下面课程项目二细节

  • 成绩评定

    • 迟交一天(24小时)打折10%, 不接受晚交4天的作业和项目(任何时候理由都不接受)

    • 大作业,包括习题和程序: 40%

    • 课程项目一: 30%

    • 课程项目二: 30%

    • 作业要求:i) 计算题要求写出必要的推算步骤,证明题要写出关键推理和论证。数值试验题应该同时提交书面报告和程序,其中书面报告有详细的推导和数值结果及分析。 ii) 可以同学间讨论或者找助教答疑,但不允许在讨论中直接抄袭,应该过后自己独立完成。 iii) 严禁从其他学生,从互联网,从往年的答案,其它课程等等任何途径直接抄袭。iv) 如果有讨论或从其它任何途径取得帮助,请列出来源。

课程项目二细节

  • 分组: 自由组合一般两人一组,可以一个人。如果是两人组队,期末项目报告里请明确说明各自分工

  • 选题

    • 大致分为文献综述,模型项目,算法项目,理论问题

    • 题目请从 “课程项目文献” 里选择。 题目也可以自由选择。如果该项目在其它课程里或其他老师组里同时进行,请明确说明。 如果该课题是以往工作的延续,请明确说明。

    • 文献综述:挑选一篇感兴趣的文献,写文献综述

    • 模型项目: 挑选你感兴趣的应用问题,探索用最优化算法或数值代数算法解决。

    • 算法项目: 挑选一个或者一类问题,提出新的算法或者已有算法的变形

    • 理论问题:分析一些模型或算法的理论性质

  • 重要日期和提交内容:

    • 3月5日前,提交分组和选题信息, 具体课题在中期报告提交前还可以修改,

    • 5月7日晚12点(不接受晚交报告), 中期报告请点击此链接上传
      中期报告不超过3页纸(单面)。需要描述你们组的选题,已经完成的工作,你们将要做哪些事情
      提交的文件名为 “proj2rep1-name1-name2.pdf”. 比如如果成员为Pengyu Qian 和 Junzi Zhang,则文件名为 proj2rep2-PengyuQian-JunziZhang.pdf

    • 6月14日晚12点(不接受晚交报告),书面报告 (包括latex源文件,程序等等打包, 请点击此链接上传
      提交的文件请全部打包,文件名为 “proj2-name1-name2.zip”. 比如如果成员为Pengyu Qian 和 Junzi Zhang,则文件名为 proj2-PengyuQian-JunziZhang.zip

挑战项目 (持续更新)

  • 实现线性规划单纯形法,能成功求解netlib测试集里所有问题:
    LP test problems from netlib
    成功求解:判断是否有可行解,是否无界,最优性条件(primal and dual infeasibility, duality gap)的违反度是否达到1e-6以下。参考 SDPT3 user guide 里sec. 3.3(第11-12页).
    故事:You have to figure out who your customer is going to be – An interview with Bob Bixby

  • 实现线性规划内点法,能成功求解netlib测试集里所有问题(标准如上题)。

  • 设计能充分利用GPU并行的线性规划单纯形法或内点法,测试性能是否有显著提升。可以挑一个大规模线性规划例子测试。

  • 选择一个问题:压缩感知,低秩矩阵恢复,鲁棒主成分分析,相位恢复,社区检测,读懂凸优化模型跟原始问题解的等价性证明

  • 选择一个问题:低秩矩阵恢复,鲁棒主成分分析,相位恢复,社区检测,考虑其非凸模型,读懂其局部极小点性质相关问题论文

  • 证明ADAM 算法的收敛性性质

  • 选择一个线性代数问题,设计随机算法

  • 选择一个机器学习模型或算法,建立半定规划模型,分析理论性质

课程项目文献