#头条家时光##与的有趣对话#
我从事的是数据分析工作,在这篇文章中,我将向你展示如何使用-ai使进行对话,包括可视化和提示,实现自动化数据分析,感觉数据分析师职业也要被AI替代了。
为什么使用-ai?
AI是对的有价值的补充,因为它通过融入生成性人工智能特性来增强这个库的能力。通过使用 AI和结合,用户可以利用AI的力量进行预测建模、数据合成和模式识别等任务。它扩展了的功能,而不是替换它,使用户可以在他们的数据分析和处理工作流程中无缝地利用AI技术。这种组合使用户能够使用传统的数据处理技术和AI驱动的方法,从他们的数据中探索并获得更深入的洞察,比如一些常见的应用:
哪些特性或属性对车辆安全等级贡献最大,比如刹车性能、安全气囊部署或结构设计?
影响患者结果或治疗效果的最重要因素是什么,如年龄、性别、既往疾病或药物剂量?
哪些因素对交货时间影响最大,如交通拥堵、天气条件或行驶距离?
如何使用-ai
首先我询问:
给出了很详细的解释和说明,然后我让它给一个示例:
由于无法生成真实的数据集,给了一个示例数据集合代码。
下面我们开始使用-ai,我们首先需要导入库
提示:你可以在 中执行此任务,你需要确保已安装,或者,使用你最舒适的集成开发环境(IDE)。
as pd
from
在这个例子中,我们使用一个样本数据帧。
提示:数据集为结构化数据提供了一种方便直观的表格形式表示方式,类似于电子表格或SQL表,数据集的表格结构允许易于组织、可视化和操作数据。
#
df = pd.({
“”: [” “, ” “, “”, “”, “Italy”, “Spain”, “”, “”, “Japan”, “China”],
“gdp”: [552, , 24, , 16, 60, 04, 04, , 064],
“”: [6.94, 7.16, 6.66, 7.07, 6.38, 6.4, 7.23, 7.22, 5.87, 5.12]
})
你需要一个 API秘钥,你可以访问这个页面来获取(),在开始之前,你可能还想看看API密钥安全的最佳实践()。
# a LLM
from .llm.
llm = (=””)
你可以直接使用对话的形式让-ai执行简单或复杂的查询,让-ai对你的数据进行EDA,绘制图形,计算相关性和协方差,进行时间序列分析。
= (llm, =False)
(df, ='Which are the 5 ?')//幸福指数最高的5个国家
以上代码返回以下内容:
6
7
1
3
0
Name: , dtype:
(
df,
“Plot the of for each the gpd, using for each bar”,
)//直接告诉AI绘制国家直方图,显示每个国家的gpd,对每个条形图使用不同的颜色
以上代码返回以下内容:
接下来我使用网络上的数据集在 lab里面进行了使用:
下面我直接采用对话的方式告诉-ai需要绘制什么图形即可:
每一个提示第一个参数是数据集名称,第二个是你的数据分析目的要求
用绘制的苹果股票时间序列图。使用-ai创建和分析
: ( apple, “Plot the ‘Adj Close’ value. Set the size of the to 13.5 x 9 “,)(绘制 'Adj Close' 值,将图像大小设置为 13.5 x 9 英寸 )
使用的自行车时间序列图,使用-ai创建和分析
: (,“Plot the Berri 1 . make the =(15, 10)”,)(绘制 Berri 1 列,设置 =(15, 10))
: (, “Plot the Berri 1, Br?beuf (donn?es non ), C?te–, 1, 2, du Parc, -Dupuy, , St- (donn?es non ) . make the =(15, 10)”,)
使用的 311服务请求柱状图。使用-ai创建和分析
: (, “Plot the top 10 most ”,)(绘制十大最常见投诉)
提示 使用的散点图,使用-ai创建和分析
: (tips,“Plot two , one for Male and for , the value and tip , by or no . They must be side by side. “,)(绘制两个散点图,一个代表男性,一个代表女性,展示总账单值与小费关系,根据是否吸烟区分。他们必须并排。)
使用的箱形图,使用-ai创建和分析
: (tips,“Plot a box plot the per day the time ( or Lunch “,)(绘制一个箱形图,展示每天的总账单在时间(晚餐或午餐)的区别)
垃圾邮件数据可视化图,使用-ai进行分析。
: (df2, What’s the by ?)(目标的分布情况是什么?)
垃圾邮件数据可视化图,使用-ai进行分析
: (df2, What are the data roles in ?)(在不同字段中的数据角色是什么?)
可视化图,使用-ai进行分析
: (df2, “What of sent come from ?”,)(来自蒙特利尔的发票占所有发票的百分比是多少?)
可视化图,使用-ai进行分析
: (df2, “What of sent come from ?”,)(来自多伦多的发票占所有发票的百分比是多少?)
可视化图,使用-ai进行分析
: (dfmap,“What was the of Spain in 2007?”,)(2007年西班牙的人口是多少?)
可视化图,使用-ai进行分析
: (“dfmap,“What was the of the UK in 2007?”,)(2007年英国的人口是多少?)
从上面的几个示例可以看出,使用-ai只需要进行提示命令描述即可,不需要在写大量的代码和查看可视化api用法,我测试了一下,目前好像中文命令还不支持。
使用-ai的十大方式数据清理和预处理数据探索和描述统计数据处理和转换时间序列分析数据可视化统计分析数据分组和聚合数据集成和合并数据建模和机器学习数据导出和集成五大要点
增强数据分析: AI通过生成性AI功能扩展了的功能,使数据分析更先进、更复杂。
改善数据质量:通过AI驱动的数据填充和验证技术, AI可以通过填补缺失值,识别数据错误或不一致性,并确保数据的完整性,从而提高数据质量。这将导致更可靠、准确的分析结果,减少不完整或错误数据的潜在影响。
加快洞察力和决策速度: AI自动化了某些分析任务,减少了数据探索和建模所需的手工工作。通过利用AI能力,它加速了产生洞察的过程,使分析师和科学家能够更有效地做出明智的决策。
扩展数据探索可能性: AI的生成性AI能力与的数据处理功能的结合,为数据探索开启了新的途径。分析师可以执行数据扩充,创建模拟数据集,生成合成离群值,使全面的分析和场景测试超越了原始数据集的限制。
无缝集成和可扩展性: AI与和其他流行的库顺畅地集成,确保与现有工作流程的兼容性,扩展了数据分析生态系统的功能。 最后的想法 AI作为著名的库的强大扩展,为其注入了生成性人工智能能力。通过结合和AI的优势,它为数据分析、探索和决策打开了令人兴奋的可能性。 AI拥有数据合成、异常检测、预测建模和NLP等功能,使用户能够深入洞察,应对数据挑战,推动创新。无论是扩充数据
最后的想法
AI作为著名的库的强大扩展,为其注入了生成性人工智能能力。通过结合和AI的优势,它为数据分析、探索和决策打开了令人兴奋的可能性。 AI拥有数据合成、异常检测、预测建模和NLP等功能,使用户能够深入洞察,应对数据挑战,推动创新。无论是扩充数据集,填充缺失值,还是生成合成离群值, AI都为转换和探索数据提供了多功能的工具包。它对于希望解锁数据集全潜力的数据科学家、分析师和研究员来说,是一种宝贵的资产。
感谢你阅读这篇文章! 我真的很感激!
发表回复