SEO的本质是用正确的文本内容连接到正确的网页,通过点击给正确的用户一个有用的答案。
通常会很习惯的把网站经营分成三个部份:
1. 内容:包含新闻报道,产品介绍,讨论等。
2. 介面:包含分类、网站结构、索引、功能、搜索、演示等。
3. 行为: 包括营销、广告、互动等。除了阅读之外,这也促使用户有使用内容的动机。SEO虽然在某些方面属于中间界面,但还是需要对内容和外部行为进行引导。也就是说,SEO的本质就是把错误的内容给对的用户。不仅有内容驱动的引导,还有一种用户行为驱动的方法,即用户-数据驱动UI再设计(User-Data Drivent UI redirect),即了解用户行为,特别是将其引入媒体和网站,或者通过了解用户进行后期分析,然后给出优秀的引导,而不管是否影响所谓的“爬虫/爬虫”。但SEO从用户寻求信息得到满足的方向去引导才是最重要的。
只是事情有那么简单吗?,基于“隐私”的原因,谷歌对来自搜索结果页面的HTTP协议的Refer进行了一次跳转加密。这样一来,网站系统就无法通过搜索引擎知道用户访问这个网站/网页的原因(搜索关键词),这看似没什么,但意味着运营商无法知道用户为什么来这个网站。更别说因为来这个网站满足用户需求的“情况”,可以给用户不同的界面。
即使扣掉这问题, 事实上问题还更多:
1. 的网站都有网站地图或统计数据库来查找所有内容。
2. 并非所有内容都有标签或关键词,可以分析其要点。不是所有的网页上都安装了Google Analytics,或者说很难算出来人,问题不是要讨论,而是要解决。
在数据挖掘部分,我尝试了各种方法来建立关系:1. 阅读体验、2. 标签关系、3. 搜索结果、4. 搜索历史等等方式, 只是这些都会面临到一个问题: “须要建立资料库与搜集资料", 这个或许对有实力的大家而言不是问题, 但对于小公司, 或者是大政府, 这困难度是相当高的, 所以我一直在想有什么可以取代这方法的….
而在去年时, Google Search Console API 终于释出时, 我发现这是很不错的出口, 因为:1. 设定 (认领) Search Console 不须要埋码, 可以用 GA, 档案, Meta 以及 Domain Name 来授权, 其中网域对于政府机关相当有用.
2. 很多网站没有好的 Sitemap, 而 GSC 做了最基本的 Index (索引), 甚至是肯定有效有意义可以导流的网页.
3. 对于网站没有编辑去定义标签, 所以利用使用者的关键字帮忙做标签定义, 尤其是可以是多种情境下的联集.
4. 这资料虽然是有限, 但还是可以回溯 90 天, 所以更新周期可以降低, 且本来就不太须要耗资源去存与抓.
5. 这个关键字往往包含情境, 也就是若是用网页与关键字的关系来建立距离(关系), 是一个很好的 Relation Analysis (关联分析).
所以在过年期间利用时间实作出来, 然后经过几次的演算法调整, 终于调到满意的结果, 甚至有新的发现:
1. 因为这不是单从内容去做分析, 而是使用者搜索点击去分析, 所以更像是情境分析.
2. 因为这是搜索曝光的联结, 有时网页会被移除会失效, 当使用者到了不存在的网页时, 透过搜索的历史资料, 可以导到最有可能寻找的内容, 不再只是404回首页.
3. 因为这是在 Google 的搜索行为记录的, 所以不须要额外搜集资料, 即使是新的网站, 认领授权后三天后也可以开始.
4. 因为是行为的关系, 这种标签不再只是从作者与编辑观点做出发, 更是由使用者出发, 所以更像是 User Data Driven 的 UI 设计.
5. 因为有了这样的关键字资料库, 可以进一步的做面包屑, 甚至做自动产生的标签系统.
像下面就是透过某 3C 网站跑出来的结果.
seo, 关键字, 使用者资料驱动
从这边不只可以做内容推荐, 商品推荐.
谁说Search Console 只是用来看SEO 的, 事实上真正要做的是透过使用者行为来检视文章的内容, 甚至是透过这样的使用者资料, 做为进一步的User Data Driven UI Design, 进一步的“用对的文字内容连到对的网页连接, 给对的使用者来去点击而得到有用的答案", 这样就可以提升CTR, 透过内容与使用者的没合让网站更有价值.
因此, 在接下来2017 年SEO 的第10 项重点, 就是透过API 取得资料, 做为User Data Driven 的Redesign, 谁说SEO 已死, 是那些人跟本没抓到重点, 所以下一篇就是“谁说SEO 已死, 那些该死的黑帽手法本来就不应存在"……