的传说已经是人尽皆知。

小编也是的重度粉丝,已经依靠它帮助我完成或者优化了许多工作。随着人工智能的又一次变革而来的就是有关“人机大战”的火热争论。AI会不会代替人类?哪些行业会出现失业?我们会被AI威胁到人身安全吗?相关的文章铺天盖地。

我们知达数据曾经讨论过数据分析师是否会被代替的分析。简而言之,目前最近5年还不会。数据分析师的主观能动性还是能起到很大的作用。但是,可以辅助我们完成许多工作,这会极大地提高我们的效率。所以小编尝试与合作来一起完成一次数据分析旅程。

先说结论,在与愉快(折磨)的合作以后,我最大的感受如下:

1. 人必须引导才能产出高质量的工作,它不能进行一条龙服务。

2. 输出的内容很多时候是笼统的,并且不准确的。需要有选择性的摘取信息。

3. 几乎不能抓取和获取随意要求的数据。

4. 很难进行大批量的数据分析。

5.对于一些基础的分析(预测,聚类,比例,对比 ),可以提供很清晰的思路

6. 可以提供代码方案,但是难以实现高质量的自行输出。

让我们先和来一次简单地分析任务热热身。为了知己知彼,我先询问了能做什么。

接着,我从手机品牌着手。大品牌的财务数据通常比较容易获取。

不错,它能抓到数据,但是这样的格式可读性太差了。

数据有了,该怎么可视化呢?

这些建议太笼统了,事实上这个数据都没有时间标签,根本就无法制作时间序列折线图。所以从这个部分开始基本上都需要人工介入。也就是我们分析师发挥用武之地的地方。我尝试直接让给我一些图表,但是它输出的链接总是不能奏效。所以我转变了方式,我让它输出了一串代码。

代码里的中文有些影响,全部改成英文以后,是可以正常运行的。

至于输出的图片,作为分析师,我只能说勉强能看…..肯定是达不到分析师的标准的。但这是因为以及我们没有设置更多的参数导致的。总是需要让完成可视化我们还需要进行更多的引导。

最后一步是描述性的分析。

分析的正确与否,质量高低,只能说见仁见智了。ok,热身结束,接下来让它试一试带一些模型计算的。

我们曾经做过一期有关预测分析的专题活动。感兴趣的小伙伴可以点击链接查看详情:

抓取数据违法吗_chatgpt 能抓取最新数据吗_抓取数据的几种方式

小编尝试过通过API外接链接的方式让读取一个数据文件,但是几次都没有成功。或许上线后能实现这个功能。所以小编仅截取了上次使用的数据的一个片段,某一个门店2013年的销售额数据。并且输入给了来让它进行一个月份的预测。

内容太长就不截取全部了。选择某个门店也是为了减小数据量,对于输入的内容长度还是有限制的。下面是它给到我们的回答,更准确的说,是一个分析指导。

且不论它给我们的方法是否是最准确的,最起码为我们提供了清晰的思路和步骤,并且是正经的时间预测的方法之一(ARIMA)。让我们来看看它给到的具体的数值结果。

看起来预测值是在一个合理的范围内。我们让它自己拿预测值和实际值进行比对。

王婆卖瓜,自卖自夸。还挺会赞扬自己的。保持这个方法,它可以继续 预测吗?

看起来是正常的一次预测。总的来说是可以完成预测任务的(小训练集)。不过像他自己说的那样,我们只能用来参考和比对,没法完全依赖。

最后小编试验了一下能否完成一次聚类分析。

小编从国家统计局数据网截取了各省2022年的生产总值以及各大产业的增加值数据,并将其输入给。

接下来我们让它依据这些指标对各个省份进行归类。类别数量也由他自行判断。

我们不想要表格的呈现形式,直接给我分类结果。

从结果来看,四个类别数量是比较合理的。每个类别里的省份还真有一定的相似性(经济规模,人口规模,产业结构等等)。确实能依据数据完成一次较好的聚类分析。但是聚类分析的底层逻辑通常是单纯的数学游戏,难以进行很明确的解释。所以该结果用来参考即可。

相信各位小伙伴能感受到,能完成数据分析过程中的某些步骤,但是数据分析师在这个过程中的引导和修正是必不可少的。我们能确定的得出结论,还无法代替数据分析师,但它不失为一个优秀的小助手。

生活中大大小小的事情,都离不开决策。我们相信数据驱动的决策行为不仅理性,而且更具有说服力。我们想借「数据星球」这个栏目触达各类生活及工作中与数据相关的场景,与大家一起了解其背后蕴含的数据思维。