
| concept | meaning |
|---|---|
| 数据 | 通过传感器等物理手段采集的无序的信息 |
| 信息 | 数据的结构化形式 |
| 知识 | 特定情况下的决策能力与专业技能 |
| 词云 | 加权后的的单词,统计出现频率 |
数据分析流程
| 步骤 | 注释 |
|---|---|
| 数据收集 | – |
| 预处理 | 异常检测、质量最重要 |
| 处理 | 运用各种算法模型,聚类、深度学习 |
| 组织数据 | 结构化形式 |
| 转化为知识 | – |
| 得到观点(答案) | 处理的目标就是解决问题,因此必须在数据中识别出我们要解决的问题 |
| graph_name | 特点 |
|---|---|
| 气泡图 | 展示所占比例,比如美国东部失业率,用气泡大小表示 |
| 箱线图 | 最值、中位数等数值的直观展现对比 |
| 核密度估计 | 类似正态分布的柱形图 |
蒙特卡洛算法——输入随机数,预测可能出现的风险
机器学习贝叶斯回归比普通线性更灵活
ML虽然看上去好像很难,但是最简单的ML算法只是一个对外不透明的函数,我们只需要输入参数即可有结果
f = npy.cos([数组]) # 返回同维度的数组,一次过计算
对上面代码的解释
参考:[印度]kirthi Raman(科斯·拉曼)——《Python数据可视化》