目录

  • 1 医学大数据概论
    • 1.1 课程简介、教学进度、学习指南
    • 1.2 基础知识
    • 1.3 医学大数据分析的特点
    • 1.4 医学大数据应用
    • 1.5 R语言的下载和编辑窗口基本介绍
    • 1.6 授课课件
  • 2 常用大数据工具
    • 2.1 Hadoop简介
    • 2.2 Python简介
    • 2.3 R语言
      • 2.3.1 R语言简介
      • 2.3.2 数据对象及基本操作
    • 2.4 Matlab简介
    • 2.5 Weka简介
    • 2.6 认识R语言的编译环境
      • 2.6.1 认识R语言的编译器RStudio
        • 2.6.1.1 RStudio的安装
        • 2.6.1.2 RStudio的编辑窗口
        • 2.6.1.3 RStudio的常用快捷键
  • 3 第3章 医学大数据的获取
    • 3.1 医学大数据的来源
    • 3.2 结构化数据的获取
    • 3.3 非结构化数据的获取
    • 3.4 生物组学大数据的获取
    • 3.5 医学公共数据库简介
    • 3.6 R语言数据读写
      • 3.6.1 程序包安装与加载
      • 3.6.2 数据读取
      • 3.6.3 数据保存
      • 3.6.4 数据合并
      • 3.6.5 数据排序
      • 3.6.6 基础的数据可视化
      • 3.6.7 课堂案例代码
      • 3.6.8 R表达式中常用的符号
      • 3.6.9 课件
  • 4 数据预处理
    • 4.1 为什么要进行数据预处理
    • 4.2 数据对象及数据描述
    • 4.3 数据预处理的主要方法
      • 4.3.1 数据提取
      • 4.3.2 数据集成
      • 4.3.3 数据清理
      • 4.3.4 数据变换
    • 4.4 思维导图、授课课件
  • 5 回归分析
    • 5.1 回归分析概述
    • 5.2 一元线性回归
      • 5.2.1 建立模型
      • 5.2.2 模型评估
      • 5.2.3 预测
    • 5.3 多元线性回归
      • 5.3.1 多元线性回归模型建立、评估与预测
      • 5.3.2 最优回归模型选择
    • 5.4 logistic回归
      • 5.4.1 建立模型与模型评估
      • 5.4.2 预测
    • 5.5 授课课件
  • 6 数据降维
    • 6.1 数据降维概述
    • 6.2 主成分分析方法
      • 6.2.1 主成分分析基本原理
        • 6.2.1.1 PCA的定义
        • 6.2.1.2 PCA的步骤
        • 6.2.1.3 PCA的优缺点
      • 6.2.2 主成分分析应用实例
    • 6.3 授课课件
    • 6.4 岭回归和lasso(选学)
  • 7 关联规则
    • 7.1 关联规则概述
    • 7.2 apriori算法
    • 7.3 关联规则评估方法
    • 7.4 关联规则r语言实现
    • 7.5 本章课件PPT
  • 8 分类方法
    • 8.1 什么是分类
    • 8.2 决策树概述
    • 8.3 信息熵与信息增益
    • 8.4 ID3算法及R实现
    • 8.5 算法性能度量-混淆矩阵
    • 8.6 ID3算法性能提升方法
    • 8.7 随机森林
    • 8.8 朴素贝叶斯
    • 8.9 分类算法评估
    • 8.10 第7次课课件
    • 8.11 第8次课课件
  • 9 聚类分析
    • 9.1 课件
    • 9.2 相似性的度量方式
    • 9.3 层次聚类法
    • 9.4 kmeans方法
  • 10 马尔科夫预测
    • 10.1 课件
    • 10.2 基本概念
    • 10.3 状态转移矩阵
    • 10.4 稳态概率
    • 10.5 应用实例
  • 11 总复习课件
    • 11.1 课件
    • 11.2 5.4 岭回归
R语言数据读写