天南之城的后花园

记录精彩的程序人生

文章

AI Agent入门(一)资源贴

此文章为入门资源贴,包括:书籍《大模型应用开发:动手做 AI Agent》《深度强化学习》涵盖开发与理论基础;Blog & Github推荐Awesome-AGI-Agents项目,包含文章、视频、论文、前沿项目及开发平台,及AI agents stack,解析agent技术架构;论文聚焦多智能体深度强化学习,探讨了算法、应用与挑战。

AC自动机

520. 检测大写字母 我们定义,在以下情况时,单词的大写用法是正确的: 全部字母都是大写,比如 "USA" 。 单词中所有字母都不是大写,比如 "leetcode" 。 如果单词不只含有一个字母,只有首字母大写, 比如 "Google" 。 给你一个字符串 word 。如果大写用法正确,返回 true ;否则,返回 false 。 示例 1: 输入: word = "USA" 输出: true 示例 2: 输入: word = "FlaG" 输出: false 思路 ac表示当前状态,state表示输入状态 由第一个字母大小写决定ac初状态 word[0]大写:ac初状态0 word[0]小写:ac初状态2 当ac初状态0时(即首字母大写):下一个字母可以大写,也可以小写 当ac初状态2时(即首字母小写):下一个字母只能小写 当ac状态为1时(即前n个字母均大写):下一个字母只能大写 当ac状态为2时(即当前字母小写):下一个字母只能小写 以上状态转移失败均跳转到ac=4,具体流程如图所示。 python实现: class Solution: def detectCapita....

Jupyter NoteBook虚拟环境配置

Jupyter NoteBook虚拟环境配置 step1 查看虚拟环境 打开Anaconda Prompt 输入: conda env list step2 创建虚拟环境 输入: conda create -n name(要创建的虚拟环境的名字) python=版本 中间输入y表示确认 输入: conda activate opencv 进入虚拟环境 通过 conda list 可以查看该环境下的库: 如果想要删除虚拟环境,输入以下命令即可: conda remove -n name(要删除的虚拟环境的名字) --all 也可以用pip管理该环境下的库,具体细节上会有一些不同。pip list 和 conda list的不同 step3 conda换源 使用conda进行下载时常常会出现网速慢的情况,我们可以通过更换下载源,获取更快的下载速度。 输入以下指令查看所有下载源: conda config --show channels 只有一个defaults,表示默认下载源,可能会导致下载速度过慢,我们更换下载源。 conda config --add channels ht....

Kaggle数据可视化(六)选择图表类型并定制样式

在本课程中,您已经学习了如何创建许多不同的图表类型。现在,您将在学习一些可用于更改图表样式的快速命令之前,对知识进行组织。 你学到了什么? 由于并不总是容易决定如何最好地讲述数据背后的故事,我们将图表类型分为三个广泛的类别来帮助解决这个问题。 趋势 - 趋势被定义为变化的模式。 sns.lineplot - 折线图最适合展示一段时间内的趋势,多条线可以用来展示多个组的趋势。 关系 - 有很多不同的图表类型可以用来理解数据中变量之间的关系。 sns.barplot - 条形图用于比较不同组对应的数量。 sns.heatmap - 热力图可用于在数字表格中查找色彩编码模式。 sns.scatterplot - 散点图展示两个连续变量之间的关系;如果使用颜色编码,我们还可以展示与第三个分类变量的关系。 sns.regplot - 在散点图中包含一个回归线可以更容易地看到两个变量之间的线性关系。 sns.lmplot - 如果散点图包含多个颜色编码的组,则此命令用于绘制多条回归线。 sns.swarmplot - 分类散点图展示连续变量和分类变量之间的关系。....

Kaggle数据可视化(五)直方图与密度图

在本教程中,您将学习所有关于 直方图 和 密度图 。 设置笔记本 像往常一样,我们从设置编码环境开始。(这段代码是隐藏的,但是你可以通过点击右边紧挨着这段文字下面的“代码”按钮来解除隐藏。) import pandas as pd pd.plotting.register_matplotlib_converters() import matplotlib.pyplot as plt %matplotlib inline import seaborn as sns print("Setup Complete") Setup Complete 选择数据集 我们将使用由150种不同的花组成的数据集,其中每种花分别来自三种不同的鸢尾属(Iris setosa,Iris versicolor和Iris virginica),每种50个。 加载和检查数据 数据集中的每一行对应于不同的花。有四个测量值:花萼的长度和宽度,以及花瓣的长度和宽度。我们还跟踪相应的物种。 # Path of the file to read iris_filepath = "../input/iris.csv" #....

Kaggle数据可视化(四)散点图

在本教程中,您将学习如何创建高级 散点图 。 设置笔记本 像往常一样,我们从设置编码环境开始。 import pandas as pd pd.plotting.register_matplotlib_converters() import matplotlib.pyplot as plt %matplotlib inline import seaborn as sns print("Setup Complete") Setup Complete 加载并检查数据 我们将使用一个(伪造的)保险费用数据集,看看我们是否能够理解为什么一些客户比其他客户支付更多的费用。 如果你愿意,你可以在这里阅读更多有关数据集的。 # Path of the file to read insurance_filepath = "../input/insurance.csv" # Read the file into a variable insurance_data insurance_data = pd.read_csv(insurance_filepath) 像往常一样,我们通过打印前五行来检查....

Kaggle数据可视化(三)条形图和热力图

现在你已经能够创建自己的折线图了,是时候学习更多的图表类型了! 顺便说一下,如果这是你第一次在Python中编写代码,你应该为你所取得的成就感到非常自豪,因为学习全新的技能从来都不容易!如果你坚持学习,你会发现一切都会变得更容易(而你构建的图表也会更加令人印象深刻!),因为所有图表的代码都非常相似。像任何技能一样,编码随着时间和重复变得自然。 在本教程中,你将学习条形图和热力图。 设置笔记本 像往常一样,我们首先设置编码环境。( 这段代码是隐藏的,但是你可以点击下面的“代码”按钮将其显示出来。 ) import pandas as pd pd.plotting.register_matplotlib_converters() import matplotlib.pyplot as plt %matplotlib inline import seaborn as sns print("Setup Complete") Setup Complete 数据选择 在本教程中,我们将使用来自美国运输部的数据集来跟踪航班延误。 在 Excel 中打开这个 CSV 文件会显示每个月一行(其中....

Kaggle数据可视化(二)线性图表

在本教程中,您将学习足够的 Python,以创建看起来很专业的 线性图表 。然后,在下面的练习中,您将把您的新技能用于处理真实世界的数据集。 准备好笔记本 我们从设置编码环境开始。 import pandas as pd pd.plotting.register_matplotlib_converters() import matplotlib.pyplot as plt %matplotlib inline import seaborn as sns 选择数据集 本教程的数据集跟踪音乐流媒体服务Spotify 上的全球每日流量。我们关注2017年和2018年的五首流行歌曲: "Shape of You", by Ed Sheeran (链接) "Despacito", by Luis Fonzi (链接) "Something Just Like This", by The Chainsmokers and Coldplay (链接) "HUMBLE.", by Kendrick Lamar (链接) "Unforgettable", by French Mon....

Kaggle数据可视化(一)seaborn引入

欢迎来到数据可视化! 在这门实践课程中,你将学习如何使用 seaborn 这个强大而易于使用的数据可视化工具,将你的数据可视化提升到一个新的水平。为了使用 seaborn,你还需要学习一些 Python 编程语言的知识。尽管如此, 本课程旨在面向那些没有编程经验的人,而且 每个图表都使用简短而简单的代码,使 seaborn 比许多其他数据可视化工具(如 Excel)更快更容易使用。 因此,如果你从未写过一行代码,想要学习最基本的知识,从今天开始制作更快、更有吸引力的图表,那么你来对地方了!要查看一些你将制作的图表,请查看下面的图例。 设置环境 您需要在每个笔记本的顶部运行几行代码来设置您的编码环境。现在理解这些代码行并不重要,因此我们还不会深入到细节中。 import pandas as pd pd.plotting.register_matplotlib_converters() import matplotlib.pyplot as plt %matplotlib inline import seaborn as sns 加载数据 在这个笔记本中,我们将使用一个历史FIFA....

kaggle机器学习入门(五)随机森林

介绍 决策树让你面临一个难以决定的问题。一个带有很多叶子的深树会过度拟合,因为每个预测只来自于其叶子上的几栋房屋的历史数据。但是,叶子较少的浅树性能表现不佳,因为它无法捕捉原始数据中的许多差异。 即使是今天最先进的建模技术也面临着欠拟合和过拟合之间的紧张关系。但是,许多模型都有巧妙的想法,可以带来更好的性能。我们将以随机森林为例。 随机森林使用多棵树,并通过平均每个组件树的预测来进行预测。它通常比单个决策树具有更好的预测准确性,并且在默认参数下工作得很好。如果你继续建模,你可以学习更多性能更好的模型,但其中许多模型对于获得正确的参数非常敏感。 例子 你已经多次看到了加载数据的代码。在数据加载结束时,我们有以下变量: train_X val_X train_y val_y import pandas as pd # Load data melbourne_file_path = '../input/melbourne-housing-snapshot/melb_data.csv' melbourne_data = pd.read_csv(melbourne_file_path) #....

kaggle机器学习入门(四)决策树

介绍 我们将从机器学习模型如何工作以及如何使用它们的概述开始。如果您以前做过统计建模或机器学习,这可能感觉很基本。别担心,我们很快就会建立强大的模型。 本课程将让你在经历下面的场景时建立模型: 你表弟在房地产投机上赚了几百万。因为你对数据科学的兴趣他提出要和你做生意伙伴。他负责提供资金,你负责提供预测各种房屋价值的模型。 你问你的堂兄过去是如何预测房地产价值的,他说这只是直觉。但是更多的问题表明,他从过去看到的房子中识别出了价格模式,并利用这些模式来预测他正在考虑的新房子。 机器学习也是如此。我们将从一个叫做决策树的模型开始。还有更精确的模型可以给出更准确的预测。但是决策树很容易理解,它们是数据科学中一些最好的模型的基本构件。 为了简单起见,我们将从最简单的可能的决策树开始。 它只将房屋分为两类。其中房屋的预测价格是同一类别房屋的历史平均价格。 我们使用数据来决定如何将房屋分成两组,然后再次确定每组中的预测价格。从数据中捕获模式的这一步称为 “拟合” 或 “训练” 模型。用于拟合模型的数据称为 训练数据 。 关于模型如何拟合的细节(例如如何分割数据)非常复杂,我们按下不表,以后再说。....

kaggle机器学习入门(三)过拟合与欠拟合

模型实验 既然您有了一个可靠的方式来测量模型的准确性,您可以尝试使用其他模型并查看哪个能够提供最佳的预测。但是,您可以为模型提供哪些备选方案呢? 在scikit-learn的文档中,您可以看到决策树模型有许多选项(您长时间内可能都不需要或不想用到)。最重要的选项决定了树的深度。请回忆一下本课程第一篇文章中介绍的,决策树的深度是一种度量它在进行预测前多少次分裂的指标。这是一棵相对较浅的树。 在实践中,一棵树在顶层(所有房屋)和一个叶子节点之间分裂成10个部分并不罕见。随着树越来越深,数据集被切割成房屋更少的叶子节点。如果一棵树只有一个分叉,它将数据分为两组。如果每个组再次分叉,我们将得到4组房屋。如果我们通过在每一层添加更多的分叉来不断加倍分组数量,那么到达第10个级别时,我们将拥有\(2^{10}\)个房屋组。即1024个叶子。 当我们将房屋分配给许多叶子节点时,每个叶子节点中也有较少的房屋。房屋非常少的叶子节点将给出非常接近这些房屋实际值的预测,但它们可能会为新数据提供非常不可靠的预测(因为每个预测仅基于几个房屋)。 这种现象被称为 过度拟合,其中模型几乎完美地匹配训练数据,但在验....

kaggle机器学习入门(二)sklearn入门

构建模型 您将使用 scikit-learn 库来创建模型。在编码时,这个库被写成sklearn,正如您在示例代码中所看到的。Scikit-learn很容易成为存储在DataFrames中的数据类型建模的最流行的库。 建立和使用模型的步骤是: 定义: 它将是什么类型的模型?决策树?其他类型的模型?模型类型的其他参数也被指定了。 拟合: 从提供的数据中捕获模式。这是建模的核心。 预测: 字面意思。 评估: 确定模型预测的准确性。 这里是一个使用scikit-learn定义决策树模型并用特征和目标变量进行拟合的示例。 from sklearn.tree import DecisionTreeRegressor # 定义 model。为 Random_state 指定一个数字,以确保每次运行都得到相同的结果 melbourne_model = DecisionTreeRegressor(random_state=1) # 拟合 model melbourne_model.fit(X, y) DecisionTreeRegressor(random_state=1) 许多机器学习模....

kaggle机器学习入门(一)使用Pandas熟悉数据

使用Pandas熟悉数据 任何机器学习项目的第一步都是熟悉数据。你可以用Pandas库。Pandas是科学家用来探索和操纵数据的主要工具。大多数人在他们的代码中将Pandas缩写为pd。我们按章行事。 import pandas as pd Pandas库最重要的部分是DataFrame。DataFrame持有类似于表格的数据类型。这与Excel中的表格或SQL数据库中的表类似。 Pandas有针对这种类型数据的大多数操作的强大方法。 例如,我们将查看澳大利亚墨尔本的房价数据。在练习中,您将应用相同的过程到一个包含爱荷华州房价的新数据集中。 示例(墨尔本)数据存储在文件路径 ../input/melbourne-housing-snapshot/melb_data.csv 中。 我们使用以下命令加载和探索数据: # save filepath to variable for easier access melbourne_file_path = '../input/melbourne-housing-snapshot/melb_data.csv' # read the data an....

记录精彩的程序人生

© 2025 天南之城的后花园

Powered by Bolo
Theme bolo-sakura by Mashiro
浏览 50959 文章 43 评论 11
蜀ICP备2023008301号

主题 | Theme