Maison >développement back-end >Tutoriel Python >初学python和机器学习,想知道怎样才能达到自己独立编写程序的能力?

初学python和机器学习,想知道怎样才能达到自己独立编写程序的能力?

WBOY
WBOYoriginal
2016-06-06 16:23:151377parcourir

我正在学习python。以前大学学过一点C.但是只能应付考试的水平。现在从事零售业,但是确实太热爱计算机和编程。买了一本python学习手册和一本python核心编程在看。但是把字符串,字典,列表看完以后感觉很困惑。因为虽然上面的习题都能做,但是不知道怎样用这些来构建一个程序很多代码和函数定义都一知半解,即使明白算法的运作原理但是却无法独立不看书写出属于自己的代码。只能单纯照着书上的代码写。我想知道怎样才能将这些知识转变成能够自己写出属于自己的代码的能力。我想以后从事机器学习或者数据挖掘的工作。

回复内容:

先把Python练好,第一遍过完教程之后,可以从生活中拿一些小需求来练手,找一些别人的代码看看,尝试重写一遍。知乎上相关的问题可以关注一下:
Python 有哪些一千行左右的经典练手项目? - 编程
你是如何自学 Python 的? - 调查类问题
Python 的练手项目有哪些值得推荐? - 编程

在学Python期间,可以看看机器学习或数据挖掘的书,比如:
在数据分析、挖掘方面,有哪些好书值得推荐? - 书籍推荐
如何系统地学习数据挖掘? - 数据挖掘

然后慢慢试着实现一些算法,参加阿里的天池比赛或kaggle练练手,就算入门了吧,再想办法找个相关的工作,慢慢的就能进入大道了 有部分从事机器学习,科学计算的研究生,编程不大会,直接上python 第三方库,硬写代码,会碰到很多困难,建议补补基础知识。
自己能不能写代码解决问题,是衡量有没有学会编程的方法。

建议不能只学语法,需要学习计算思维,编程思路,解决问题的方法。

请看黄哥本人写的文章
如何捅破python编程的那层纸
article/pythonstudy.md at master · pythonpeixun/article · GitHub

剪刀石头布小习题三种语言python2、php、go代码
article/jdstb.md at master · pythonpeixun/article · GitHub
一段小代码说明@property装饰器的用法
一段小代码说明@property装饰器的用法


如何捅破python编程的那层纸之二
如何捅破python编程的那层纸之二

如何捅破python编程的那层纸之三
如何捅破python编程的那层纸之三



黄哥python远程视频培训班
article/index.md at master · pythonpeixun/article · GitHub

黄哥python培训试看视频播放地址
article/python_shiping.md at master · pythonpeixun/article · GitHub 推荐给你一本书《集体智慧编程》。
里面所有的例子都是用python写的,由浅入深,不要看一遍就过,把所有的代码敲一遍,你会从中学到很多东西。

相对于python,这本书给我的感觉更像是你需要的那种思想,利用编程解决问题的那种思想。

最后说一句,在你成长的过程中或许会受到质疑,不要去理会,做自己想做的事,你的成功就是消灭质疑最有力的武器。

加油 不是打击你自信心
在中国,想做机器学习这一行的,基本都要研究生
而且你都工作了,只能社招,阿里大数据竞赛可能你就参加不了

面试时候,面试官问你个快速排序,二叉树什么的,估计你就写不出来
面试官再问你,操作系统啊,计算机网络啊,海量数据啊等等知识,你觉得你该怎么应对呢
既然是机器学习,起码面试时候会来几个推导一下机器学习数学过程吧,然后再扯一点统计学概率论什么的,再问几个C++或者Java知识也不为过吧,然后再聊聊现在很热的Hadoop/Spark/Storm等等

如果你想去小公司做数据挖掘机器学习当我没说(但是小公司去做机器学习基本直接从大公司挖人过来的),想去中等或者大公司的话,我觉得除非你在KDD或者Kaggle上做出很好的成绩了,否则,还是准备考研把,或者就平时想想就算了吧(毕竟全中国在做和数据挖掘相关岗位的人也不多,岗位需求也不大)

最后建议,真的很喜欢Python和机器学习的话,去做个数据运营挺不错的 用python写一写机器学习实战里面的代码,了解一些简单的聚类分类算法原理,能写kmeans,朴素贝叶斯啥的就行了,因为这些都有第三方库,如果不做数据量太大的话直接用sklearn这个库,特别方便。如果数据量大的话要分布式的话我只用mapreduce写过不分布式也有很多现成的库,所以机器学习算法这方面主要是要懂原理,知道每个算法怎么去应用。

分类的算法那么多,遇到具体数据集应该用那种就需要理解每种算法的原理和联系,比如遇到非正态分布的数据分类时用LDA不可以,遇到离散数据分类时可能用决策树,这些都不是绝对的,哪个好用哪个。机器学习算法那么多,想了解所有的太困难,每个大类了解一些基础的baseline,用到哪块再具体研究。比如推荐系统这方面,基础的算了解之后,做比赛发现仍然不能出好的效果,因为数据预处理是很重要的,无论在比赛还是在项目中,而数据预处理就要用到很多很多机器学习算法。

至于工作里面,不是很了解,但是经过实习3个月了解到的就是,机器学习用的不多,多的是找规则,筛选数据,无穷无尽。。。 你的水平连Python的门都没入,建议不要想着写程序,机器学习,先把Py语法弄懂,一些OOP语言的特性熟练以后再去做打算。 你刚把列表字典看完,路还远着呢,可以看看慕课网教程,每个知识点都有习题 感觉好像是没有任何基础,都不知道该从哪里说起了。
你可以用sklearn,先在小规模数据上应用机器学习算法试试。
或者你可以看看《机器学习实战》和《集体编程智慧》 重在练习,可以上checkio做题,挺适合初学者的,难度适中,完成一道题后,看看别人的答案,还是挺有收获的。
Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn