目录

  • 1 Chapter01. Introduction
    • 1.1 课程PPT
    • 1.2 补充材料(数学基础)
    • 1.3 本节作业
  • 2 Chapter02. Bayesian Decision Theory
    • 2.1 课程PPT
    • 2.2 视频素材
    • 2.3 章节测试
  • 3 Chapter03. Maximum Likelihood and Bayesian Estimation
    • 3.1 课程PPT
    • 3.2 视频素材
    • 3.3 补充材料(EM)
  • 4 Chapter04. Nonparametric Techniques
    • 4.1 课程PPT
    • 4.2 补充材料(距离)
  • 5 Chapter05. Linear Discriminant Functions
    • 5.1 课程PPT
    • 5.2 视频素材
    • 5.3 补充材料(梯度)
    • 5.4 数学证明
  • 6 Chapter06. Neural Networks
    • 6.1 课程PPT
    • 6.2 视频素材
    • 6.3 补充材料(BP)
  • 7 Chapter07. Dimension Reduction
    • 7.1 课程PPT
    • 7.2 补充材料(奇异值)
  • 8 Chapter08. Non-metric Methods
    • 8.1 课程PPT
  • 9 Chapter09. Unsupervised Learning and Clustering
    • 9.1 课程PPT
    • 9.2 实验
  • 10 Chapter10. Algorithm-independent Machine Learning
    • 10.1 课程PPT
    • 10.2 补充材料(偏差方差两难)
    • 10.3 实验
  • 11 课程实验
    • 11.1 实验环境设置
    • 11.2 python数据常用导入方法
    • 11.3 数据探索
    • 11.4 数据预处理
    • 11.5 朴素贝叶斯分类
    • 11.6 KNN分类
    • 11.7 线性回归
    • 11.8 逻辑回归
    • 11.9 SVM实现多分类
    • 11.10 决策树分类
    • 11.11 PCA实现
    • 11.12 K-means聚类实现
实验环境设置

实验 Scikit-learn机器学习库的实验环境设置

实验目标

本实验旨在帮助学生搭建一个适用于Scikit-learn机器学习库的计算机实验环境,确保学生能够在该环境中顺利运行和调试Scikit-learn相关的代码。

实验报告要求

1. 实验环境描述:记录实验所使用的操作系统、Python版本、所安装的库及其版本。

2. 安装步骤和遇到的问题:详细描述安装过程中遇到的任何问题及其解决方法。

3. 环境验证:展示验证安装成功的代码和结果。

4. 测试环境:展示测试环境所使用的代码和结果,包括模型的准确率等。

5. 实验总结:总结实验过程中的收获和遇到的问题,以及对未来使用Scikit-learn进行机器学习的展望。

通过完成本实验,学生将能够搭建一个适用于Scikit-learn的计算机实验环境,为后续进行机器学习实验打下坚实的基础。

实验环境要求

1. 操作系统:Windows、macOS或Linux。

2. Python版本:建议使用Python 3.6及以上版本。

3. 必要的库:

o NumPy:用于数值计算。

o Pandas:用于数据处理和分析。

o Scikit-learn:机器学习库。

o Matplotlib/Seaborn:用于数据可视化(可选,但推荐)。

o Jupyter Notebook/Lab:用于交互式编程和结果展示(可选,但推荐)。

实验步骤

1. 安装Python

o 从Python官方网站下载并安装最新版本的Python(确保勾选“Add Python to PATH”选项)。

2. 安装必要的库

o 使用pip(Python的包管理工具)安装所需库。打开命令行工具(如Windows的CMD、PowerShell,macOS的Terminal,或Linux的终端),然后输入以下命令:

pip install numpy pandas scikit-learn matplotlib seaborn jupyterlab

或者,如果你使用的是conda(Anaconda或Miniconda的包管理工具),可以使用以下命令:

conda install numpy pandas scikit-learn matplotlib seaborn jupyterlab

3. 验证安装

o 打开Python解释器或Jupyter Notebook,尝试导入所安装的库,确保没有错误发生。

import numpy as np  

import pandas as pd  

from sklearn import datasets  

import matplotlib.pyplot as plt  

import seaborn as sns

4. 配置Jupyter Notebook(可选)

o 如果选择使用Jupyter Notebook进行编程,可以通过在命令行中输入jupyter notebook来启动它。

o 你可能还需要配置Jupyter Notebook的扩展和主题,以提高编程体验。

5. 设置IDE(集成开发环境)

o 你可以选择使用PyCharm、VS Code等IDE来编写和运行代码。这些IDE通常提供了代码高亮、自动补全、调试等功能,可以提高编程效率。

o 在IDE中配置Python解释器和所安装的库。

6. 测试环境

o 编写一简单的Scikit-learn示例代码,如加载数据集、训练模型、预测结果等,以确保环境配置正确。


实验代码参考

————————————————

# 导入python库


# 加载数据集(以iris数据库为例)  


# 划分数据集(测试集占20%)  


# 训练模型  


# 预测结果  


# 计算准确率并打印  

————————————————