設爲首頁收藏本站客戶端下載

老榕樹(shù)社區

 找回密碼
 立即注冊
社區推薦
 
任務統計:
發布數/完成數/獎勵數:
0/0/0
承接數/獎勵數/收入數:
0/0/0

3495

主題

4228

帖子

2985

積分

管理員(yuán)

Rank: 9Rank: 9Rank: 9

積分
2985
掃一掃,手機訪問本帖
跳(tiào)轉到指定樓層
樓主
發表于 2016-12-10 11:46:58 | 隻看該作者 回帖獎勵 |倒序浏覽 |閱讀模式
【如内容違法或虛假,請聯系上述郵件删除】   
  我是(shì)一個純采集站長,下面的這些總結,有些是(shì)關于關于SEO,有些是(shì)關于采集和運維,都是(shì)很基礎的個人見(jiàn)解,僅作分享,請自辨好壞是(shì)非,理論出真知(zhī)。

  原創好還是(shì)采集好?
  當然是(shì)原創好,由于百度是(shì)這麽說的,誰叫人家是(shì)裁判。
  爲什麽我原創了很多文章,還是(shì)不收錄?收錄了沒排名?
  一個搜索引擎,它的中心價值是(shì)要爲用戶提供他/她最需求的結果。搜索引擎是(shì)有統計網民需求的,關于網民需求量小或者簡直沒有需求的内容,即便你是(shì)原創也可能被搜索引擎疏忽,由于它不想糜費(fèi)資源在無意義的内容上。
  對網民需求量大的内容,收錄應該會比較多、比較快,但(dàn)是(shì),正由于收錄多,即便你是(shì)原創,也可能很難擠進排名。
  搜索引擎統計網民需求以什麽來标識?
  關鍵詞。每一個人搜索一個關鍵詞時,就标明他/她對這個詞相(xiàng)關的内容有需求。而且,運用搜索引擎的人,通常是(shì)有問答需求、檢索查詢需求。當然搜索引擎内部肯定有十分龐大的剖析系統,對這些需求中止精确的定位,詳見(jiàn)百度指數。比如搜索的關鍵詞是(shì)"手機",很有可能是(shì)想要買手機或者查某款的價錢,也可能隻是(shì)想要下載漂亮的壁紙(zhǐ)。但(dàn)是(shì),假如是(shì)想要壁紙(zhǐ),就會有更精确的關鍵詞"手機壁紙(zhǐ)",以下拉框或者相(xiàng)關搜索的方式呈現(xiàn)出來。
  既然原創好,爲什麽要采集?
  1. 固然原創好,但(dàn)隻需辦法恰當,采集的效果并不會比原創差多少,以至比沒控制到辦法的那些原創好很多。
  2. 肉體有限,原創很難保證長期大量更新,假如請個編輯,投入産出比可能是(shì)負數。
  市面上采集器那麽多,應該用哪個好?
  每個采集器都有它的共同之處,所謂存在即合理。請依據自己的需求來選擇即可。我的采集器是(shì)自己開發的,開發的過程中思索了以下幾方面,運用其他采集器的也可作參考:
  1. 直接提供已分類的海量關鍵詞,這些關鍵詞都是(shì)百度曾經統計的有網民需求的詞(有百度指數),或者是(shì)這些詞的長尾詞,來自百度下拉框或相(xiàng)關搜索。
  2. 直接按關鍵詞采集,智能剖析網頁正文中止抓取,不需求自己寫采集規則。
  3. 抓取到的正文經過規範的标簽清算,段落全部以
  标簽呈現(xiàn),亂碼一概去(qù)除。
  4. 依據采集到的内容自動配圖,圖片一定是(shì)與該内容相(xiàng)關度十分高的。以這種方式替代僞原創,既不影響可讀性,又(yòu)使文章圖文并茂,做到比原創所提供的信息更豐厚。
  5. 正文内容中的關鍵詞自動加粗,也可自定義要插入的關鍵詞。但(dàn)沒有做句子重排、段落重排等影響可讀性的所謂"僞原創"功用。
  6. 可直接運用關鍵詞和其相(xiàng)關詞組協作爲标題,也可抓取目的網頁标題。
  7. 可中止微信文章采集。
  8. 不用觸發或者挂機。
  9. 集成百度站長平台主動推送,加快收錄。
  不同的網站程序,比如織夢、WordPress、dz、zblog、帝國cms或者其他,對SEO有什麽影響?
  理論上沒有影響。由于搜索引擎并不知(zhī)道你是(shì)什麽程序,或者它能夠經過一些規則辨認出來,也不可能由于程序自身的不同而影響它的判别。
  那什麽會影響SEO呢?答案是(shì)模闆。由于基本上這些程序都有模闆機制,同樣程序能夠輸出不同的頁面,不同的程序也能夠輸出同樣的頁面,這就是(shì)模闆。模闆肯定之後,你的每一個頁面就依照這個框架來輸出,也就是(shì)整個html結構曾經肯定。而這些html,正是(shì)搜索引擎要重點關注的,它得從這些html中得到它想要的信息。因而,一套好的模闆十分重要。
  模闆設計應該留意哪些細節?
  1. 權重結構次第。整個頁面的html中(留意是(shì)html,而不是(shì)顯現(xiàn)出來的版面),越靠前的位置,權重越高。由此引申出來,"title"、keyword、description三個标簽,由于最靠前,權重最高。其次通常是(shì)導航,也是(shì)基本上是(shì)最靠上的,權重也十分高。再次就是(shì)文章标題和正文。這是(shì)依據html的前後來排序的。
  2. 由于搜索引擎首先要遵照W3C規範,所以,W3C定義的一些原本就是(shì)用來表示重要信息的标簽,權重自然就高,比如,特别是(shì)h1,用來表示當前頁面最重要的信息,普通每個頁面隻能有一個,其權重估量與title相(xiàng)當,也通常是(shì)用來放(fàng)當前頁面的标題,當然也有爲了進步首頁權重,用h1來放(fàng)置logo或首頁鏈接,都是(shì)能夠的。另外還有em、strong這樣的标簽,用來表示強調,普通以爲strong權重高于标簽,同樣也是(shì)加粗作用,但(dàn)我們以爲從SEO的角度看是(shì)沒有權重增強的。
  3. css或者js代碼對搜索引擎來說通常是(shì)無意義的,盡量運用單獨的文件來寄存,或者在允許的狀況下放(fàng)到html尾部去(qù)
  網站結構規劃應該留意哪些問題?
  1. URL設計。URL也是(shì)能夠包含關鍵詞的,比如你的網站是(shì)關于電腦的,你的URL中能夠包含"PC",由于它在搜索引擎眼裏通常是(shì)"電腦"的同義詞。URL不要太長,層次盡量不要超越4層,這個就點到爲止。
  2. 欄目設計。欄目通常是(shì)與導航相(xiàng)關聯的,設計時應該思索網站整體的主題,用戶可能會對哪些内容感興味,欄目稱号最好是(shì)網站的幾個主關鍵詞,這樣也便當應用導航的權重。
  3. 關鍵詞規劃。理論上每一個内容頁都應該有它的中心關鍵詞,同一個欄目下的文章,盡可能盤繞欄目關鍵詞展開。一個簡單粗暴的辦法就是(shì)直接用欄目關鍵詞的長尾詞。
  動态、僞靜态、靜态,這三者哪個好?
  這個不能混爲一談,引薦運用僞靜态或靜态。這三者的區别,是(shì)能否生成靜态文件,以及URL格式能否動态。生成靜态文件,實質上是(shì)爲了加快訪問速度,減少數據庫查詢,但(dàn)會不時增加占用空間;僞靜态隻是(shì)經過URL重寫修正URL,實踐上還是(shì)每次都要經過程序運算、查詢數據庫再輸出頁面,對加快訪問速度完整無效。動态與僞靜态的差别隻在于URL,帶問号加參數。
  所以關注兩個點就好:網站翻開速度能否夠快?你能否需求節約效勞器空間?
  不同的網站程序,數據庫操作的效率可能不同。普通來講,内容頁數量在1萬以内的,頁面翻開速度都是(shì)比較快的,數據量更大一些,抵達5萬、十萬以至更多,通常就要思索靜态化了。
  有哪些途徑改善訪問速度?
  1. 上面曾經說到的靜态化。
  2. 通常很多網站模闆中都有随機調用文章或者相(xiàng)似的版塊,事實上對數據庫來說,随機是(shì)一項比較重的擔負,在模闆中應該盡量減少随機文章的調用。假如不可避免,能夠思索從數據庫上優化,對有索引的字段排序通常比沒有索引要快很多。
  3. 将圖片、js、css等不經常修正的文件,放(fàng)到專用的靜态效勞器上,多個js、或者多個css能兼并的盡量兼并到一個文件,減少http銜接次數。
  4. 運用各類雲加速産品。對普通網站來說,免費(fèi)的百度雲加速或者360的雲加速都還能夠。
  文章比較多,網站曾經開啓靜态,但(dàn)是(shì)每次全站更新都要花很長時間怎樣辦?
  我的做法是(shì)運用緩存機制,這裏隻提供一個思緒,可能需求自己二次開發。
  網站設定爲僞靜态,每一個央求抵達時,程序檢查能否存在對應的緩存html文件,假如該文件的生成時間是(shì)多少小時或幾天以前,我們判定它需求更新,這時分執行正常流程,程序查詢數據庫,生成html後,寫入到緩存文件,再輸出到客戶端。
  當下一次訪問抵達時,比如1分鍾以後又(yòu)來一個訪問相(xiàng)同頁面,再次檢查緩存文件時間。從時間上能夠判别文件十分新,完整不用更新,則直接讀取文件内容輸出到客戶端。這樣每個頁面都能夠完成自動生成,也隻需第一個訪客會感遭到速度慢(màn),後面的訪客訪問時都相(xiàng)當于是(shì)靜态訪問,速度是(shì)十分快的。
  假如是(shì)獨立效勞器,還能夠思索自動檢測效勞器負載,假如負載原本就高,那就算判别出來需求更新,也暫時不更新,改爲直接輸出。
  圖片是(shì)援用遠程網址好還是(shì)放(fàng)在自己效勞器好?
  這個也是(shì)各有優劣。援用遠程網址,能夠節約自己的帶寬,但(dàn)很可能會由于對方效勞器遲緩、或删除資源、或防盜鏈,圖片無法顯現(xiàn)。假如下載到自己效勞器,當然一切都自己掌控,但(dàn)是(shì)圖片會十分占用空間,總體上可能比生成靜态所占的空間更大,而且假如訪問量大,圖片是(shì)最吃帶寬的。
  網站内鏈應該怎樣優化?
  内鏈是(shì)百度官方引薦的優化伎倆之一,所以這是(shì)一定要做的。通常表現(xiàn)的方式是(shì)正文中呈現(xiàn)某個關鍵詞,給這個關鍵詞加上一個鏈接,指向另一個正好是(shì)這個關鍵詞相(xiàng)關内容的頁面。因而就降生了一些所謂的優化手法,強行在正文中插入一些關鍵詞和鏈接,以此中止相(xiàng)似互推的操作。還有的爲了進步首頁權重,四處都放(fàng)上網站稱号,并做上首頁鏈接,以爲這樣能夠進步目的頁面的權重。但(dàn)是(shì)這些很可能都是(shì)适得其反,由于搜索引擎會統計每個鏈接的點擊率。假如放(fàng)在醒目位置點擊卻很少的鏈接,有可能會判别爲作弊。所以,請隻在正文中原本就有的關鍵詞上做内鏈,就能夠了。
  段落重排、句子重排、同義詞交流這些僞原創手法到底好不好?
  不好。由于搜索引擎曾經智能,曾經不是(shì)簡單的數據庫檢索,它會自然語義剖析(詳情請搜索"NLP"),凡是(shì)語義解析比較艱難的句子或者段落,它是(shì)能夠判别爲可讀性差的,所以我以爲這些"僞原創"可能是(shì)自作聰明。
  評論模塊基本上沒有人用,該要還是(shì)不要?
  要。評論模塊最頭疼是(shì)事情是(shì)渣滓評論,通常真正發言的訪客很少,渣滓評論一大堆,整天和營銷軟件鬥智鬥勇。這裏提供一個我曾經完成的計劃,對收錄可能有一定輔佐(沒有依據的,隻是(shì)猜測):
  保管評論框、但(dàn)遏止評論。一切評論由自己的網站程序生成。前面提到搜索引擎會自然語義剖析,其中有一項重要的才幹,就是(shì)情感判别。搜索引擎會計算每條評論的情感值,是(shì)positive(積極)還是(shì)negative(消極),細緻傾向是(shì)10%還是(shì)90%。假如評論内容表達的是(shì)積極情感,則能夠給你的正文加分,反之則減分。至于怎樣自動生成積極的評論,就八仙過海各顯神通吧。
  這是(shì)在網絡社交展開起來後的必然趨向,用這種方式來反映一個頁面的用戶體驗度。同理還有分享、點贊等,原理相(xiàng)似。
  綠蘿蔔算法之後,外鏈到底還有沒有用?
  有用。參見(jiàn)搜索引擎三定律之相(xiàng)關性定律。既然是(shì)定律,就不會改動。誰的内容被援用得多,誰就是(shì)權威。在主動推送呈現(xiàn)之前,外鏈應該算是(shì)蜘蛛認識一個頁面内容的第一渠道。
  外鏈一定要錨文本或者裸鏈嗎(ma)?
  不是(shì)。搜索引擎肩負重擔,要努力發現(xiàn)真正有價值的東西,掃除那些沒價值的東西。所以有可能你直接提交的鏈接沒收錄,在他人中央随意發個純文本網址,被它發現(xiàn)了,還計算了加分。
  除了錨文本和裸鏈,還能夠用關鍵詞+網址的方式發純文本。這樣在網址前面的那個關鍵詞是(shì)會自動與該網址關聯的。
  還有,有些鏈接固然加了nofollow屬性,但(dàn)是(shì)在百度計算外鏈的時分,還是(shì)會計算的。
  收錄和索引到底什麽關系?
  收錄表示蜘蛛來抓取過、剖析過。索引表示蜘蛛剖析之後,以爲内容有一定價值。隻需進入索引的内容才有可能出往常搜索結果中,展示給用戶。也就是(shì)說隻需索引的内容才有機遇帶來流量。

                                                    
(關注老榕樹(shù)網絡旗下“網絡思維”微信公衆号:wlsw360 (每天都有好文章)

 

                                                   本帖如有虛假或違法,請聯系郵箱删除,本社區删貼不收任何費(fèi)用,歡迎舉報。老榕樹(shù)社區屬老榕樹(shù)網絡旗下網站,旨在爲老榕樹(shù)用戶提供創業咨詢、網站建設技術交流、源碼下載、提供各種實用工具。如有部分帖子涉及違法、虛假,請你第一時間與社區聯系,把需要删除的社區鏈接提供給我們,我們核實之後,第一時間删除。郵箱:125175998@qq.com

回複

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 立即注冊

本版積分規則

  • 關于我們| 企業文化| 備案編号:滇ICP備13002355号
  • Copyright 2013 最新最精彩-社區論壇 版權所有 All Rights Reserved
快速回複 返回頂部 返回列表