查看原文
其他

访问量最高超7百万的Stack Overflow问题竟然是...

Jane AI科技大本营 2019-03-31


整理 | Jane

出品 | AI科技大本营(公众号id:rgznai100)


Stack Overflow,一个面向开发者的 IT 技术问答网站,很多程序员都会在上面提问,浏览问题,查找技术知识。在 Top Question 页面,我们可以根据 Hot、Week、Month,亦或是标签对问题进行筛选过滤。当我们想对上面的问题进行数据统计与分析时,这些功能显然不够直观与聚合。

     


近日,一位来自 Google 的开发者 Felipe Hoffa 发表了一篇文章,分析 Stack Overflow 上不同时间、不同语言的热门问题,他用了一个交互式的数据展示界面,无论是让概览问题还是分析数据都变得非常简单。


首先,你可以在左上方的折线图中看到不同时间的热门问题 Top10(时间统计单位为季度)

     


其次,你可以在右侧的选项栏中根据 tag、 top for quarter、section 和 subtag 四个选项进行数据筛选。


技术类别根据此类问题浏览总量由低到高排列。

     


选择 tag 后,还可以选择此技术类别下的 sub tag。

     


问题不仅可以看 Top10,还可以看 Top30 前的三个区间。


而在问题罗列区,我们可以看到除问题本身外,还有问题发起时间、回答数量及排名等信息。

     


有了上面这些内容与数据的直观展示,作者对一些数据进行了统计与分析,下面我们就一起来看看 Stack Overflow 上的用户在过去和现在都在关注哪些问题。


1.最热门的问题:所有时间 VS 2018 Q4


下面的数据显示的是在 Stack Overflow 上,迄今为止关注度最高的十个问题:

     


最火的十个问题涉及了五个话题,4 个与 Git 相关,3 个与 JavaScript 有关,Java、Linux 和 html 的问题各有一个,没有任何一个问题涉及目前很火热的 AI、大数据乃至 Python 等技术领域。


也许受时间积累的影响?那我们回到最近一个季度(2018 Q4)的数据中,看看哪些是近几个月有哪些热门问题?

     


两个图表的数据对比发现,近期的十个热门问题中,新增了 4 个 Python 问题,其他 6 个并没有发生变化。问题“如何撤销 Git 中最新的 commits?”一直位居 Top1 的位置,浏览量直逼 8 百万,仅上个季度的浏览量就达到了 40 万+,但是都没有 Java 的问题上榜。


2.问题领域发生了哪些变化?

     

     

看过 Top 10 的数据后,我们把数据范围拓展到热门问题 Top30。Python 相关的问题成为最近最受关注的领域,相比全部时间里的问题 Top 30,最近的一个季度里,已经没有 Java 和 SQL 相关的问题了。


3.JavaScript、Python 和 Go 三类语言中,最受关注的十个问题(时间截止到 2018 Q4)


下面的三幅图分别展示了截止到 2018 年的 Q4,JavaScript、Python 和 Go 语言的问题 Top 10,以及这十个问题在过去两年的时间里的变化趋势:


  • 学 JavaScript 的开发者们一直在问“如何从数组中删除特定元素?”

  • Python 学习者们问的最多的问题是“使用 for 循环迭代字典”

  • 而 Go 语言的开发者们最想知道“将字节数组转换成字符串的最佳方法”


我们还能从图中看到,随时间的推移,大部分问题的关注度并没有很大的波动,然而却也有一两个问题,上升趋势变化非常明显、突出。比如:




JavaScript 问题中“如何获取当前数据”与”如何四舍五入时,保留小数后面两位“,这两个问题(蓝色与紫色)在 2017 年的 Q3 和 Q4 期间分别有关注度下降的趋势,但随后关注度反升,并且以很快的速度缩短了与其他问题访问量的差别,截止到 2018 年 Q4,差距已经远没有一开始时悬殊了。




Python 问题也有此类现象,”如何将字符串解析为浮点数或整数“,这个问题从 2017 年的 Q4 季度到 2018 年的 Q3 季度,近一年的时间都是下降趋势,然而就从 2018 年 Q3 季度开始却突然反温,一下减少了与上一名问题之间的差距。


更有甚者,问题”如何利用 Pandas 在数据结构中根据列选择行“,在一开始并没有太多人问,却从 2017 年 Q4 季度开始上升势头迅猛,不断超过其他问题,跃居 Top5。这一年中学习使用 Pandas 的开发者们看来增多了不少啊!




Go 语言的问题中,”如何列出目录中所有文件“这个问题的关注度一直在增加,到最后还反超了两个问题的浏览量。


这些问题是否也曾让你纠结烦恼呢?

4.TensorFlow 的挣扎


怎么能少了近几年发展最快的人工智能领域。开发者们在 AI 技术领域中又在频频问哪些问题呢?

     


TensorFlow 可以说是使用人数最多的深度学习框架了,问的最多的问题是”不能用 pip 方法找到 TF“、”怎么查询我系统中安装 TF 的版本信息“或是当前 CPU/GPU 组合能力等问题。看来大家在入门时遇到了很多共同问题,相信这些问题随着时间的推移,也仍然是最常被问的问题。


5.其他类别的热门问题 Top10


1.Redis 及子类与 Java 和 C# 相关的问题


开发者们问的最多的是”如何在 Windows 上安装“。Redis+Java 中的问题大多与 Spring 相关,和 C# 中问的最多的是想要简单实例。

        




大家如果想看更多分析与查询语句,可访问


https://towardsdatascience.com/finding-the-real-top-stack-overflow-questions-aebf35b095f1


最后,给大家分享这个数据交互界面的地址,看看 Stack Overflow 上的小伙伴们都在问些什么?


数据交互界面:

https://datastudio.google.com/reporting/1UUTtohIB1fBH7e8An-6AhEn4AyU3eMjd/page/QwNg



(本文为AI科技大本营原创文章,转载请微信联系 1092722531)


群招募


扫码添加小助手微信,回复:公司+研究方向(学校+研究方向),邀你加入技术交流群。技术群审核较严,敬请谅解。

推荐阅读:

                         

点击“阅读原文”,查看历史精彩文章。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存