Maison  >  Article  >  développement back-end  >  用R语言的公司多吗?

用R语言的公司多吗?

WBOY
WBOYoriginal
2016-06-06 16:23:132162parcourir

用R语言的公司多吗?用R做数据分析或者数据挖掘的。本科生,想自学,R和Python都学了一点点。本科统计学。R用起来顺手点..没其他编程基础...想知道市场人才需求方向。初次提问...希望有人给点解答啦!谢谢

回复内容:

也说虚一点的话,生物界用R的很多,互联网的话,貌似python比R火一点,因为python比R应用范围广,而且互联网界码农较多,搞统计的较少……
来点实在一点的,你可以用R或者PYTHON自己去写一个爬虫,去爬一下如拉勾网-最专业的互联网招聘平台,NLPJob或者英才网乃至国外的一些知名招聘网站,看看里面1000个岗位,要R的有多少,要python的有多少,既锻炼技术,又能直观了解行情,还玩一下你的技术,我之前刚玩爬虫的时候,首先爬的就是招聘网站信息罒__罒
爬虫,R指路rvest+rcurl 之前在艾瑞咨询实习的时候,我的leader(职位是高级数据挖掘工程师)跟我说,现在在企业中,R主要是用来做可视化(ggplot2确实强大),做建模分析主要是用Python,数据预处理主要是用SQL。他解释到:R跑的慢,而且对于算法的优化很有限(因为已经封装好了)。用Python做建模分析,主要是从底层编写算法,这样可以针对具体的问题,对算法进行优化。再加上Python相对R而言跑得更快,所以Python在建模方面更有优势。 上面的回复多数是从数据分析的角度评论R,我想从数据分析之后的角度comment一下:
我们数据分析之后需要将分析出来的结果做成报告( 或者是模型,仪表盘等), R做报告的时候可以用R markdown,python可以用IPython。如果是做模型或者仪表盘的话,虽然R也有很多包可以完成这个任务,但是你会发现python会有更多resource可以融合,使用更灵活,而R里的各种包里function是固定好的,相对更依赖制作package的作者。总的来说,用R做数据分析和报告都很便捷,需要熟练掌握,在这个基础上尽力学好python。这样的话在以后做任何数据产品的时候将会更得心应手。 尝试回答一下,和大家探讨。

互联网行业计算机出身的人比较多,团队里程序员同事一般会在数据分析师的周围,一些数据需求也会由这些程序员导出。由于计算机专业的人偏好Python,所以Python在数据导出这部分占了很大的比重。当然前提是SQL熟悉的情况下,使用Python结合SQL写脚本导出数据。Python功能太强大,就不一一说明了,下面说说R比较厉害可用的地方。

R主要是统计出身的人喜欢用,但是在互联网公司,这个真的是小众,技术规定也不希望团队使用,个人使用就没问题。R在数据分析师平时的工作中,主要是统计建模,和可视化处理。由于rmarkdown能写作自动报告,因此很适合用作自动化报表的开发,结合Linux环境crontab调度,可以很好地实现自动报表的功能。

扩展来说,R自动报表和可视化的能力,也很适合搭建在线模型监测系统和AB测试模型系统。比如说每天会在服务器里跑一个统计模型,每日更新交易数据后,第二天调度更新模型。作为统计系出身的你,应该很清楚每个模型都需要做完备的假设检验,而这部分最好同时结合可视化的报告与检验的值去观察下结论。这时候,由于自动分析报告已经就绪,你完全可以花几分钟观察一下,再决定是否去调整某些参数。这里的每日,可以频繁到每小时甚至更短。当然,报告每天发一次估计就足够了。

AB测试其实也主要是利用了自动报表,每天自动分析测试结果。结合模型方法,会有相当好的监测效果。更加统计的方面,是对测试用户的均匀抽样,这个抽样是否均匀,也是可以可视化报告展现的。对应不同的测试要求,抽样频次同样可以不同。真实情况中,测试抽样用户集的情况,直接影响是否正确实验的成败,我认为是非常非常重要的。不然,AB测试的结果不会可靠。 先说点虚的,R语言从世界编译语言排行44上升到12名;
然后,以我目前了解,无论是电子商务、通信、金融都有很多实用R,因为它的开源性以及众多包和接口,使得很多人都在实用。
最后,前几天看到一些JD,上面写着实用R语言18个月,薪资15-25K。 用R做数据分析和数据挖掘的电子商务公司还是比较多的,比如阿里、京东、1号店等,分析团队中部分同事会使用R作为分析工具。
分析挖掘工具有很多,R是其中之一。

R语言环境很好搭建,只要一台内存较大的Linux服务器就行,在上面安装 RStudio Server(支持多人通过浏览器界面登录使用),并且使得该环境与数据库服务器通信即可(可读可写)。
基本流程是,从数据库载入数据到R环境,分析/挖掘在R中完成,并且可将结果回写到数据库中。

这是针对数据分析和挖掘挖掘而言。

不过,用R来做报表和报告是不合适的,用来作为抓取数据的程序也是不合适的,这些都是开发工作,请交给程序员来完成(数据分析师可以作为产品设计师/数据产品经理提出需求)。
R,是统计分析的语言,是“分析”工具,不是“开发”工具! 正好在一家互联网公司用R做数据分析,就来回答一下吧。
之前一直用R+SQL+excel来做数据分析,一些涉及到统计模型的东西用R做确实很方便,用SQL做初步过滤,用R做数据清洗和预处理,再用R边探索数据边建模,模型跑完后结果再写回到数据库里。模型测试成熟后可以用python或者R写脚本,做成自动化分析,看个人喜好。
但是后来部门调整后,需要接触hadoop平台上的其他业务数据,(没错就是大数据>_至于中小量的数据处理和分析,个人觉得,用R或python都可以。因为都是加载在单机内存中运算的,只要内存吃得消,都能算。但是python作为一门编程语言确实和其他语言平台结合地更好一些。
互联网行业行业本身的行业风格是偏向自由灵活化,只要能分析出合理需要的结果,是不太在意你用R用python用SAS的(SAS可能会在意,毕竟是需要花钱购买的,成本在那里)。
金融行业呢,不太了解,据说还是SAS,也见到过需要R的。
以上 python+R+SQL/NoSQL,数据分析师的标配吧 私募基金做统计套利会用,用得很广泛。我老师是一家私募基金的合伙人,他用R很多年了。
但一些咨询公司还是用商用的SAS,按实习老板的话说因为R是免费的,他们觉得不太放心, 所以做项目还是得用商用的SAS。
另外一个统计公司的朋友说他们都用SPSS,理由是完整版的SPSS很强大,只是我没见过而已。R太学院派,数据处理能力比不上商用软件。
我的观点是会R肯定是加分项。基金公司和证券公司的量化团队基本都认。 R vs python 各有长短,学起来了,很多两者通用。
Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn