数据从业者不能错过的 kaggle

工作 5 年以来,有 3 年主要是从事数据分析岗位的,从编写 SQL 到报表展示,可以说是一个熟练工种,请注意,如果自己通过短时间的培训可以快速上手,那么别人也可以,说明这个岗位很大众,接下来就要培养自己的核心竞争力,既然是核心竞争力,当然就是自己有,大多数人没有的能力,比如在一千个挑一个。在数据行业,核心竞争力就是能从数据中发现别人发现不了的价值。数据提取、数据展示这些都是成为熟练工种后可以闭着眼睛干的,数据

聊聊朴素贝叶斯

机器学习中最简单,最适合入门的算法可以说就是朴素贝叶斯了,我尽可能使用非常通俗的语言来描述,让 0 基础的人也可以看懂,希望本文能让你找到机器学习的兴趣。先举个栗子,假如一个房间里有 7 个人,其中 3 个人是日本人,4 个人是韩国人,如果这是从房间走出一个人,让你判断他是日本人的概率,显然你会说 3/7。那么,如果现在有两个房间,a 房间有 2 个日本人,2 个韩国人,b 房间有 1 个日本人,2 个韩国人,你一抬头,看到现在出

感受一下大神的力量

我自认为自己 Python 学的还行,工作中已经使用它实现了很多功能,直到今天我学习了景霄大神 Python 的课程,才发现,自己学习到的,仅仅是皮毛而已。我相信很多人也和我一样,编程语言或者其他技术工具会用就行了,几乎不会思考背后的原理和设计哲学。没错,初学者是需要快速学会使用工具或编程语言,这样学会之后可以很快投入使用,为企业提供劳动价值。仔细思考一下,这也许是大部分人认为的程序员是吃青春饭的一个重要原

e-learning 云端学习网站自动学习

现在很多单位都要求学习一些课程,但这些课程质量低,大多数员工不愿意学习,但与考核或绩效挂钩,又不得不学,为解决这个问题,以云端学习网站 http://e-learning.jsnx.net 为例,我在业余时间开发了自动学习程序,目的是节省你宝贵的时间。功能点自动登陆,可以选择自动学习我的课程或学习地图。自动播放视频课程并执行课程评估。可以自动做题,准确率 100%。可能你会问了,它是如何实现自动做题的?做

如何实现拼写纠错功能?

在使用搜索引擎时,当我们输入错误的关键词时,当然这里的错误是拼写错误,搜索引擎的下拉框中仍会显示以正确关键词为前前辍的提示,当你直接回车搜索错误的关键词时,搜索引擎的结果中仍包括正确关键词的结果。你有没有想过它是如何实现的呢?前文已经分享如何使用前辍树实现搜索框的关键词提示功能。大家很容易想到以上纠错功能的实现,关键在于给定一个错误的关键词,如何返回一个正确的关键词。最简单的方法,我们使用一个数组来

发挥特长与木桶效应是否矛盾

在学校,老师强调要学习他人的长处,弥补自己的不足。事实上我们也是这么做的,比如花大量时间学习自己弱势学科,面对考试结果,我们主要关注自己做错的题,希望以后的错误不会再犯,以便考出更好的成绩。出了学校,工作以后,便没有了标准答案,我们却仍然采用学校那种应试方法,领导分配一个任务,便去完成,如果不会,则加倍学习,很少考虑自己的优势到底是什么?时间一长,知识面变宽,什么都会,好像什么也都不会,越学习越迷茫

如何实现搜索框的关键词提示功能

我们都使用过主流的搜索引擎,谷歌、bing,当然还有搜狗、百度之类。当你搜索某一关键词时,它会贴心在下拉框补全一些热门关键词,像下图这样:你点击某一关键词,页面就直接跳转到结果页面,这种显示搜索关键词提示功能,一定程度上节省用户的搜索时间。能节省时间的东西就有价值,值得我们学习和使用。但是,在公司内部的很多系统中,搜索框中都没有这个功能。如果你能实现这个功能,那么你的用户在使用时肯定会眼前一亮,顿生

我是一个索引

在关系型数据库中,我是一名索引(Index)。大家都知道,通常情况下我都会带来查询性能的提高。需要指出的是,我并不是多多益善。我类似于一本书的目录,只不过书的内容是静态的,而数据是动态变化的。可以想像,如果书中的内容页频繁变化,那么更新书的目录也会花掉不少成本。所以说,我不是多多益善。我是数据库中一个排序的数据结构,以协助快速查询、更新数据库表中数据。如果深入了解我,并加以合理的运用,可以对查询性能

再谈装饰器

昨天我分享了装饰器的使用方法,发现看的人并不多,这也正常,毕竟装饰器是一种锦上添花的东西,没有他,无法稍微麻烦点,但还是可以凑合着过的。其实,高手和普通人就差这一点,一般人觉得学得够当下所用了,也就不愿意再花时间学习了,这样也就不会再进步了,也就成不了高手。虽然我也不是高手,但我愿意持续学习,缩短与高手之间得距离。对于我们从事 IT 职业的,学习的东西一定要使用,如果工作上没有需求,那么就自己创造需求,

我是装饰器

在 Python 的世界里,我是一名装饰器。函数或类都是我服务的对象,我不改变它们,但我会让它们更强大。一些朋友在初次接触我时觉得有点复杂,看不懂,因此对我敬而远之。其实,掌握了方法后,我并不难理解,而且学会使用我可以让你写代码时偷点懒,少点重复性工作,代码也更优雅,更具有 Pythonic。为了你让更容易理解和使用我,我先自下而上讲讲我的来历,再自上而下讲讲我的用法。小明是一个程序员,一天,他洋洋洒洒写

工作后,为什么还要学习数据结构与算法

在学习计算机课程的时候,数据结构与算法这门课是最烧脑子的课程了,当时的心态,也就是为了学习而学习,也就是说为了考试不挂科而学,为了面试能拿到 offer 而学,也体会不到数据结构与算法有多强大的威力。以这种心态学习是最没有效果的,虽然当时明白了,但考试完、面试完,很快就忘记了。工作之后,你会发现,如果你不追求极致的性能,数据结构与算法基本用不到,大家都在学编程语言本身,学框架,学习一些 IT 工具的使用,至

让 Python 自动下载网站所有文件

最近维基 jiemi 彻底公布了网站的全部文件,我就在想如何使用 Python 将其下载到本地永久保存,于是就有了这篇文章。写爬虫会遇到很多坑,借鉴他人经验,考虑越全面,出错的概率就越小。假如有这样的网站,里面有很多链接,有指向文件的,有指向新链接的,新链接点击进去后,页面上可能是文件,也可能是链接,类似一个文件夹,里面即有文件,又有目录。如何从这样的网站上下载所有的文件,并按网站的目录结构来保存这些文件呢

世界,你好!

Pipe 博客平台已经初始化完毕,可在管理后台-设置-基础设置中调整更多细节。如果需要导入已有博客文章,请参考文档 Hexo/Jekyll/Markdown 文件导入。另外,出于安全考虑请尽快完成如下操作:使用 GitHub 账号登录社区在社区个人设置-B3 中更新 B3Key 在 Pipe 管理后台-设置-账号中也进行同样的 B3Key 更新最后,如果你觉得 Pipe 很赞,请到项目主页给颗星鼓励一下 ❤️