天南之城的后花园

记录精彩的程序人生

文章

kaggle机器学习入门(二)sklearn入门

构建模型 您将使用 scikit-learn 库来创建模型。在编码时,这个库被写成sklearn,正如您在示例代码中所看到的。Scikit-learn很容易成为存储在DataFrames中的数据类型建模的最流行的库。 建立和使用模型的步骤是: 定义: 它将是什么类型的模型?决策树?其他类型的模型?模型类型的其他参数也被指定了。 拟合: 从提供的数据中捕获模式。这是建模的核心。 预测: 字面意思。 评估: 确定模型预测的准确性。 这里是一个使用scikit-learn定义决策树模型并用特征和目标变量进行拟合的示例。 from sklearn.tree import DecisionTreeRegressor # 定义 model。为 Random_state 指定一个数字,以确保每次运行都得到相同的结果 melbourne_model = DecisionTreeRegressor(random_state=1) # 拟合 model melbourne_model.fit(X, y) DecisionTreeRegressor(random_state=1) 许多机器学习模....

kaggle机器学习入门(一)使用Pandas熟悉数据

使用Pandas熟悉数据 任何机器学习项目的第一步都是熟悉数据。你可以用Pandas库。Pandas是科学家用来探索和操纵数据的主要工具。大多数人在他们的代码中将Pandas缩写为pd。我们按章行事。 import pandas as pd Pandas库最重要的部分是DataFrame。DataFrame持有类似于表格的数据类型。这与Excel中的表格或SQL数据库中的表类似。 Pandas有针对这种类型数据的大多数操作的强大方法。 例如,我们将查看澳大利亚墨尔本的房价数据。在练习中,您将应用相同的过程到一个包含爱荷华州房价的新数据集中。 示例(墨尔本)数据存储在文件路径 ../input/melbourne-housing-snapshot/melb_data.csv 中。 我们使用以下命令加载和探索数据: # save filepath to variable for easier access melbourne_file_path = '../input/melbourne-housing-snapshot/melb_data.csv' # read the data an....

菠萝 Bolo 博客系统已部署成功。

Bolo 博客系统已经初始化完毕,可在管理后台 - 工具 - 偏好设定中调整更多细节设置。如果需要导入已有博客文章,请参考文档 Hexo/Jekyll/Markdown 文件导入。 Bolo 是基于 Solo 的修改版,主打功能: 离线 分类优化 游客化评论 同步与主分支更新 欢迎你的体验! 请在设置-偏好设定中设置黑客派用户名和 B3log Key 以获得完整体验。 最后,如果你觉得 Bolo 很赞,请到项目主页给颗星鼓励一下❤️

记录精彩的程序人生

© 2025 天南之城的后花园

Powered by Bolo
Theme bolo-sakura by Mashiro
浏览 50972 文章 43 评论 11
蜀ICP备2023008301号

主题 | Theme