日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

大專學(xué)歷,轉(zhuǎn)行兩年的 Python 開發(fā)者故事

系統(tǒng) 2031 0
原文鏈接: https://gitbook.cn/m/mazi/activity/5d52baeaac15fd68e9f78297?utm_source=tw190815_501

我畢業(yè)六年了,但與技術(shù)和 Python 相關(guān)的工作經(jīng)驗也就兩年。 今天我想跟大家分享自己轉(zhuǎn)行的故事,希望能夠鼓勵那些跟我一樣的朋友共同前行。

我們將會聊到我個人的經(jīng)歷和入行故事,個人的技術(shù)成就,我 2019 年上半年和下半年的工作重點,討論快速學(xué)習(xí)的方法,最后推薦一些學(xué)習(xí)資源。

01

個人簡介和經(jīng)歷

我叫韋世東,是一名 Python 開發(fā)者,同時也正在學(xué)習(xí) Rust 語言。 我并沒有大廠履歷,也沒有太多的 IT 工作經(jīng)歷。

我喜歡用文章的方式向周邊的人分享知識,也熱衷于開源項目。 在 2018 年以前,我并不是一個專業(yè)的研發(fā),工作內(nèi)容甚至與技術(shù)沒有太多關(guān)聯(lián)。

我所學(xué)的專業(yè)是“軟件開發(fā)”,但大專念書的時候沒有好好學(xué)習(xí),導(dǎo)致畢業(yè)后四處碰壁。 畢業(yè)后的第一年輾轉(zhuǎn)進入了一個互聯(lián)網(wǎng)金融企業(yè),在技術(shù)部里面擔(dān)任最小的小弟。 隨著公司的發(fā)展和人數(shù)增加,我從小弟變成了小哥,后來成為了連接技術(shù)部和公司高層的紐帶。

從這個時候起,我離技術(shù)越來越遠,后來慢慢轉(zhuǎn)到了運營崗,并通過努力從運營小弟變成了運營小哥。 2013 年畢業(yè),到 2018 年轉(zhuǎn)技術(shù),中間 5 年時間里我也只有第一年呆在技術(shù)崗位,其他幾年都與技術(shù)無關(guān)。

這幾年我待過的崗位有: 信息安全員、技術(shù)組長、運營專員、運營指導(dǎo)、副總經(jīng)理、運營總監(jiān)

互聯(lián)網(wǎng)金融倒閉和跑路潮爆發(fā),我感到行業(yè)岌岌可危 ,而且我覺得就我這點運營水平也蹦噠不起來(說成一事無成也不為過)。

恰好那段時間我了解到 Python 語言,了解到爬蟲對于企業(yè)運營和發(fā)展的重要性,還有 Python 易學(xué)的特點。 于是我下班后看 Python 的入門教程,并根據(jù)網(wǎng)上文章嘗試運行自己編寫的代碼。

念書的時候,學(xué)校教的是 C 語言、C# 和 PHP,但我都沒有學(xué)會。 唯獨這一次,我感覺我能夠?qū)W會 Python

在家看 Python 入門文章、Python3 入門教程文章和爬蟲入門視頻。 跟著教程學(xué)習(xí)了大概 3 個月,我就嘗試自己接一些小需求來做,例如爬取一些公開數(shù)據(jù)、編寫 Python 程序等。 那時候一兩天才能完成任務(wù),得到的報酬通常是 30~300,有時候甚至靠回答群有的問題領(lǐng)幾塊錢小紅包。

自學(xué)階段,我的 Python 水平已經(jīng)達到了初級,還學(xué)會了很多爬蟲相關(guān)的技術(shù),例如網(wǎng)頁解析、數(shù)據(jù)存儲、定時調(diào)度、去重和增量爬取等,對于常見的一些反爬蟲措施也略有了解。

從零基礎(chǔ)到這個階段,我大概花了 7 個月 這時候,我覺得我能夠勝任一個初級爬蟲工程師的工作了,于是便在省會城市的人才網(wǎng)找了一些招爬蟲或 Python 研發(fā)的公司,投了簡歷。 三天內(nèi),接到了 5 個面試,然后也順利的找到了一份爬蟲組長的工作。

工作期間,我們爬蟲組的任務(wù)就是完成技術(shù)負(fù)責(zé)人分配的數(shù)據(jù)爬取任務(wù),目標(biāo)分為網(wǎng)站和 APP 兩大類。 我們公司是體育行業(yè),所以數(shù)據(jù)的變動是常有的事,這就要求爬蟲組能夠高頻的爬取數(shù)據(jù)。

為了省事,我參考 Scrapyd 和 Celery 用 Django 編寫了一套支持 Crontab 規(guī)則的調(diào)度平臺,這樣我們編寫的爬蟲就可以集中在這個調(diào)度平臺上進行管理。

在反爬蟲方面,對于那些用 JavaScript 保護數(shù)據(jù)的網(wǎng)站,我們最開始采取的是 Selenium 或者 Splash 這種自動渲染工具來應(yīng)對。 但后來考慮到高頻、時效性和資源占用等問題,便硬著頭皮去解目標(biāo)網(wǎng)站中的 JS 算法,再用 Python 模擬實現(xiàn)同樣的算法。

這樣,將爬取速度和資源占用都調(diào)整到了最優(yōu)的狀態(tài)。

我認(rèn)為我進入了技術(shù)領(lǐng)域,就應(yīng)該踏踏實實的呆在這個領(lǐng)域里,想辦法扎根。 所以我一直在尋找除了工作和外包以外的副業(yè) 我希望這個副業(yè),既能夠幫助我技術(shù)成長、提高個人水平,又能夠幫助我在技術(shù)領(lǐng)域扎根。

2018 年是知識付費蓬勃發(fā)展的一年,所以我也加入了這個行列。

我寫了一個 《Python 實戰(zhàn): 用 Scrapyd 打造個人化的爬蟲部署管理控制臺》 的電子小冊。

我發(fā)現(xiàn)在編寫小冊的過程中,我不得不逼迫自己弄清楚細(xì)節(jié),這使我的技術(shù)能力得到了進步。 于是,我便開啟了寫文章之路,一方面作為自己的“筆記”,一方面逼迫自己完善細(xì)節(jié)。 其實一開始我有寫博客,但沒有系統(tǒng)化的寫過完整文章,

后來 崔慶才 崔哥跟我說有優(yōu)質(zhì)文章可以在他的公眾號上投稿,于是我就將一些文章搬到公眾號上。 接著崔哥又邀請我做公眾號的管理員,可以自由發(fā)文。 這對我來說簡直就是雪中送炭,給了我一個很大的展示平臺。

在此,感謝崔哥對我的照顧

這一切看起來都是機緣巧合,但又不乏努力爭取和主動出擊。 就這樣,一邊工作一邊發(fā)文,我的技術(shù)水平呈直線上升態(tài)勢。 故事太多,我就不一一列舉了。

02

個人成就

不提工作上的成果,單說在技術(shù)領(lǐng)域的成就。 由于得到了崔哥的照顧,在大平臺的光芒之下,我也認(rèn)識了很多朋友,包括技術(shù)圈的朋友、媒體圈朋友和一些后來私交甚好的朋友。 作為一個剛轉(zhuǎn)行不久的“新人”,我自知難以與高學(xué)歷、大廠履歷或者多年工作經(jīng)驗的朋友相比較。 大城市和大廠對于學(xué)歷的要求近乎苛刻: 第一學(xué)歷 985/211、名校研究生或領(lǐng)域極客。

在學(xué)歷上,我已經(jīng)沒有辦法努力了。 我選擇的是“曲線行駛”的方式,爭取在其他方面能夠趕上這些大佬。 我在技術(shù)領(lǐng)域或媒體圈獲得了一些“名頭”:

比如在技術(shù)領(lǐng)域或媒體圈獲得的一些“名頭:

  • GitChat 認(rèn)證作者

  • 圖靈教育簽約作者

  • 電子工業(yè)出版社約稿作者

  • 華為云認(rèn)證云享專家

這些“名頭”看似“虛名”,但對我而言卻十分重要。 雖然它們并不是什么高級的榮耀,但這都是我努力的成果, 是我日日夜夜刻苦學(xué)習(xí)的證明,是廣大讀者和媒體朋友對韋世東的認(rèn)可,是我最寶貴的財富之一。

03

快速學(xué)習(xí)的方法

對于轉(zhuǎn)行的朋友,或者剛接觸 IT 技術(shù)的朋友來說,最重要的是兩件事:

  • 如何保持專注,能夠堅持

  • 找到快速學(xué)習(xí)的方法


第一件事其實并不難,保持專注并能夠堅持的原因通常有二: 有經(jīng)濟收入或者極大的興趣愛好。 縱觀我的成長經(jīng)歷,其實這也是我堅持下來的原因。 學(xué)習(xí)之初,完全是出于興趣和轉(zhuǎn)行的壓力。 在 3 個月的階段,有一些小小的收入也是支撐我繼續(xù)前行的主要原因。

第二件事,找到快速學(xué)習(xí)的方法。 我可以說,我的進步速度非常快,而且很穩(wěn)固。 我深深的知道 “浮沙之上難駐高臺” 的道理,所以我在學(xué)習(xí)的過程中,通過寫文章來鞏固所學(xué),并且我只專注于一個領(lǐng)域(爬蟲)。

Python 可以發(fā)展的方向非常多,例如 WEB、爬蟲、數(shù)據(jù)分析 和深度學(xué)習(xí),我自知想要扎根就必須專注一個領(lǐng)域 我從最初的網(wǎng)絡(luò)請求、網(wǎng)頁解析到數(shù)據(jù)存儲,爬蟲部署調(diào)度,再到異步、多線程多進程、去重和增量,甚至是反爬蟲的研究,都屬于爬蟲這個領(lǐng)域。

為了保持專注,我改變了我的作息時間,從原來的“早上八九點起床,凌晨一兩點睡”改成了“早上六七點起,晚上十一點睡”。 周末亦是如此,早睡早起使我有充沛的精力保持工作和學(xué)習(xí)。

選好某個領(lǐng)域,并保持足夠的時間后,能夠讓人快速進步的因素還有: 讀源碼,造輪子 讀源碼可以讓我們從更高的的角度理解程序的設(shè)計,并學(xué)到很多平時難以見到的騷操作。 而造輪子,則是 考驗我們將知識轉(zhuǎn)換成代碼的能力

我讀/研究過源碼的項目有:

  • Scrapyd

  • Scrapy

  • Celery

  • Gerapy

  • SpiderKeeper

  • SpiderWeb

  • WebSockets

  • WebsocketClient

  • Parsel

  • apscheduler

  • Job_Spider,Rust 語言編寫的定時任務(wù)庫

自己造過的輪子有:

  • aiowebsocket,Python 編寫的異步 WebSocekt 客戶端

  • Gerapy 2.0 后端(未發(fā)布),使用 Tornado 框架編寫的爬蟲項目部署調(diào)度平臺

  • django_cron_scheduler,工作期間編寫的爬蟲項目部署調(diào)度平臺

這里有個建議,讀源碼、查資料的時候我們必定會用到搜索引擎,搜索引擎列出的文章并不一定是準(zhǔn)確的。 有些文章甚至是缺頭缺尾,所以最好是 直接翻文檔或者找一些知名作者寫的文章來學(xué)習(xí)

04

上半年與下半年

2019 年上半年,我主要的精力就是放在書籍撰寫上。 這是我與圖靈教育簽約的一本反爬蟲專題的書,書本從網(wǎng)絡(luò)協(xié)議和網(wǎng)頁結(jié)構(gòu)等基礎(chǔ)開始,通過實際的案例和現(xiàn)象說明其中用到的原理和技術(shù),并將市面上常見的反爬蟲手段納入其中,作為示例。

書中對 JavaScript 代碼混淆、加密和驗證碼破解都有深入的介紹,我希望這本書能夠幫助爬蟲工程師和愛好者了解反爬蟲的手段和原理,同時也能夠幫助到前端、后端開發(fā)者了解爬蟲工程師常用的技巧和原理。 這本反爬蟲專題的書還沒有印刷出版,但相信很快就會跟大家見面了。

上半年我發(fā)布了很多內(nèi)容質(zhì)量很高的文章

大專學(xué)歷,轉(zhuǎn)行兩年的 Python 開發(fā)者故事_第1張圖片

下半年,我的主要精力依舊是放在書籍的撰寫上。 這一本是與電子工業(yè)出版社約定的爬蟲相關(guān)書籍,具體內(nèi)容這里不便透露,但也會是一本高質(zhì)量的書,希望大家多關(guān)注。

同時,還會兼顧其他技術(shù)內(nèi)容的輸出,例如這次與 GitChat 編輯策劃的 MongoDB 系列教程 這個教程目前只出了第一期 《MongoDB 實戰(zhàn)教程: 數(shù)據(jù)庫與集合的 CRUD 操作篇》 ,大體內(nèi)容如下:

  • NoSQL 的概念

  • 認(rèn)識 MongoDB

  • 在 Ubuntu 和 macOS 上安裝 MongoDB

  • 交互式接口 MongoShell的使用

  • MongoDB 數(shù)據(jù)類型

  • 數(shù)據(jù)庫和集合的 CRUD 操作


這只是開胃菜,后面發(fā)布的內(nèi)容才是重點:

  • 文檔的 CRUD 操作和 Cursor 對象

  • 掌握流式聚合操作

  • 了解 MongoDB 的查詢效率和優(yōu)化

  • 如何提高 MongoDB 的可用性

  • 如何應(yīng)對數(shù)據(jù)服務(wù)故障

  • 理解 MongoDB 的訪問控制

  • 學(xué)會用數(shù)據(jù)模型降低數(shù)據(jù)冗余,提高效率

  • 掌握 mongodump 數(shù)據(jù)備份與還原方法

這是寫給 0 基礎(chǔ)同學(xué)的 MongoDB 快速入門文章 內(nèi)容從文檔 CRUD 到流式聚合操作; 從執(zhí)行計劃、索引、數(shù)據(jù)模型到復(fù)制集; 從分片、訪問控制到數(shù)據(jù)備份與還原。 6 篇近 5 萬字的內(nèi)容覆蓋了 MongoDB 的大部分知識點,完全滿足日常開發(fā)的要求

05

學(xué)習(xí)資源推薦

學(xué)習(xí)資源是學(xué)習(xí)質(zhì)量和速度的保證,因此找到高質(zhì)量的學(xué)習(xí)資源對我們來說也是非常重要的。

如果大家感興趣,可以掃描下方二維碼入群獲取和交流

大專學(xué)歷,轉(zhuǎn)行兩年的 Python 開發(fā)者故事_第2張圖片

大家也可以加我微信: zenrusts

我們一起探討技術(shù)知識、共同進步

點擊 閱讀原文 ,查看我發(fā)布過的 Chat 文章。


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 武平县| 雷山县| 泰兴市| 城固县| 广河县| 东山县| 武冈市| 囊谦县| 白玉县| 武汉市| 沂水县| 沁阳市| 丁青县| 江安县| 涞源县| 郴州市| 泗阳县| 澄迈县| 西乡县| 白河县| 滦平县| 沧源| 陵川县| 稻城县| 巫山县| 黔西县| 美姑县| 平度市| 洪湖市| 通化县| 梁山县| 澎湖县| 保山市| 濮阳市| 东乡族自治县| 鹤壁市| 海淀区| 旺苍县| 微山县| 陆良县| 阿克|