最新文章
偽造資料對付搜尋引擎
這兩天在網路上看到一篇文章,就是封鎖某些特定的瀏覽器,利用存取網頁時產生的記錄,判定是何種Broswer,如果是我們認可的Browser或是機器人(Bot)、網路蜘蛛(Spider),才可以看我們的網頁。
這是知名的一種欺騙搜尋引擎,提升網站排名的一種手法。
百度Bot/IP Range
百度在中國是知名的搜尋引擎,但是,也讓站長們很傷腦筋,因為他的機器人設計,沒有完全依照機器人運作的規則,常常不管三七二十一,把你的站從頭到尾抓一遍(砍站),小站是還好,如果是大站,流量很有可能就會爆掉(有人被砍站砍到當站)。
另外,百度不支援sitemap的格式,也就無法依照網站地圖資訊進行檢索,這種暴力的氣法,常常讓站長們又氣又愛。氣的是亂砍站,愛的是他可以把你的資料巨細靡遺的呈現出來。
google 蜘蛛/機器人 使用的IP區段
Google網路蜘蛛(機器人)會使用下面的IP區段中的IP來檢索你的網頁。
216.239.32.0 – 216.239.63.255
64.68.80.0 – 64.68.87.255
外掛不要亂用,會影響整個網站的運作
WordPress有許多好用的外掛,當然外掛的相容性是要考慮的,另外就是外掛對整體網站運作的影響。
那天我開了一個外掛~就在右側邊欄上的那個隨機圖片~
一次開20個張圖~每個圖抓150*150 PIXEL
結果….流量多了40倍以上
為什麼多了3倍~
1個圖20k,20個圖400KB,加上文章中本來有的圖,網路蜘蛛來抓資料的流量,
多個40倍流量還算小的咧
我看了一下報表
沒有掛之前每天不約40M左右
掛了之後呢?1.5G起跳,最多到2.6G
天啊~這樣一個月就要500~700G的流量~
那個台灣的網路商頂的住啊?
我還不是人氣網站咧
測試文章
Sorry, no posts were found.
精選文章
twbbs.org所屬域名掛點 網站無法開啟
竹子不會因為被風吹過,就永遠直不起腰來
有一位在戶政事務所擔任櫃台受理工作的小姐,
終日愁眉苦臉,幾乎可以說是得了「上班恐懼症」。
她有一個習慣,每當與洽公民眾發生爭執,
挨了罵,受了氣,便在筆記簿上,寫一個小「忍」字,
如果受的是大氣,就寫一個大「忍」字。
五年多下來,筆記簿裡填滿了大大小小的「忍」字,
除了每天要揹負受氣的痛苦,
還要揹負日漸增多的「忍」字重量,她終於揹出了病來。
一位前輩發現了她的病因,想出對症下藥的方法,
「妳把之前的那本筆記簿丟掉,換一本新的,
然後將每一頁分成左右二邊,左邊寫『刁民』,右邊寫『良民』。
工作時,若是遇上『刁民』,妳就在左邊寫個忍字,
若是遇上『良民』,妳就把忍字給摃掉,
沒有忍字可供摃掉時,便在右邊劃一個笑臉。
一個星期統計一次,看看是忍字比較多,還是笑臉比較多呢?」
LINUX 純文字環境中 安裝rclone
一般的環境中,都有瀏覽器,Windows/Linux/FreeBSD都有
安裝rclone不會有什麼問題
但是在伺服器的環境中,卻沒有辦法這麼做
要怎麼讓rclone在純文字環境中跑起來呢?
下載 RCLONE
curl -O https://downloads.rclone.org/rclone-current-linux-amd64.zip
