|
Post by account_disabled on Jan 6, 2024 7:32:11 GMT
我询问了我们的 SEO 专家 Doreid使用 WooRank 的 API 并准备可能与网站相关的100.000 个搜索查询的列表。 为了扩大数量,我们首先查询维基数据来获取读者可能有兴趣阅读的 Windows 软件列表。对于任何机器学习来说,项目数据是最具战略意义的资产。因此,虽然我们希望能够生成以前从未见过的查询,但我们也希望从一开始就对机器进行毫无疑问良好的训练。 将单词与概念联系起来的最佳方法是定义这些单词的上下文。上下文主要由在 Microsoft Windows 操作系统上运行的软件应用程序表示。我们首先使用一个简单的查询对 Wikidata 图进行切片,该查询为我们提供了在 Windows 上运行的 3.780 多个软件应用程序和 470 多个相关软件类别的列表。通过扩展这个关键字和类别列表,Doreid 提出了一个 CSV 文件,其中包含我们的生成器的训练数据集。 训练数据集中的第一行。 训练数据集中的第一行。 经过几次迭代后,我能够通过 手机号码数据 应用以下值来定义性能最佳的配置。我从字符级转移到单词级,这大大提高了训练速度。正如您所看到的,我有 6 层,每层有 128 个单元,并且我正在运行 100 个 epoch 的训练。这确实是有限的,具体取决于数据集的大小,因为Google Colab 在 4 小时的训练后会停止会话(这也是一个温和的提醒,表明现在可能是从 Google Colab 迁移到 Cloud Datalab(Google Cloud 中的付费版本)的最佳时机。 文本生成器配置 文本生成器配置 在这里我们看到训练模型时生成的初始关键字 摇滚乐,有趣的部分 经过几个小时的训练后,该模型已准备好使用包含以下几行的简单 Python 脚本来 生成我们以前从未见过的搜索意图。 以下是生成查询的一些示例: 哪里可以找到 google 云端硬盘下载 在 。 哪里可以找到我的书签 如何更改谷歌浏览器的开启时间 如何删除谷歌浏览器中的无效服务器证书错误 如何从 Chrome 中删除 Google 帐户 如何从 Windows 8 模式中删除 google chrome 如何从 Windows 7 中完全删除 google chrome 如何从我的笔记本电脑中删除 google chrome 你可以玩弄温度来提高创造力结果或提供前缀指示您可能想到的关键字的第一个单词,然后让生成器计算出其余的单词。 要点和未来的工作 “智能回复”建议可以应用于关键词研究工作 ,值得从以下方面系统地评估这些建议的质量: 有效性——这是否有意义?这对人类有意义吗? 相关性——这个查询是否真的击中了网站的目标受众?或者是题外话?和 影响——考虑到我们正在工作的网站,这个关键词在竞争力和数量方面是否平衡? 初步结果很有希望,所有最初生成的 200 多个查询都与训练集中的查询不同。
|
|