01. 行列式
1.1 线性代数在数据科学中的重要性
- 线性代数、概率论、统计学和微积分是数据挖掘用于表述的“语言”。
- 在互联网大数据中,许多应用场景的分析对象(待处理的非结构化数据)都需要换成离散的矩阵或向量形式,例如,大量用户信息、文本中文本与词汇的关系等等都可以用矩阵表示。
线性代数主要研究矩阵与向量、用于处理线性关系。线性关系是指数学对象之间的关系是以一次形式来表达的。线性代数需要解决的第一个问题就是求解线性方程组。
1.2 引入案例
为了避免肥胖,提高员工的健康情况,大数据部门组织月度跑步活动。
- 规则如下:部门为参与者在月初定制月度计划,对完成目标者进行奖励,对未完成者进行惩罚,奖惩金额为:
- 其中
为第
月总奖惩金额,
为总公里数,
为月度目标,
为实际距离与月度目标的差,
为每月对每公里的奖惩金额。
- 活动影响良好,同时云部门也开展起来。以下数据为第一季度部分参与员工每月与月度目标差以及第一季度的总奖励值:
