Ozon 搜索引擎

目录

Ozon 搜索引擎不仅按商品与用户搜索查询的内容相关性对所有商品进行排序,而且还分配流量和确定优质的商品报价。 买家和卖家都会影响搜索结果。

商品在搜索结果中的序数位置会影响与商品有关的商业指标:转换率、流量和销售量。 由于搜索引擎的运行机制,卖家可以直接、透明和清楚地影响其商品在搜索结果中的排名。 由于可靠卖家的优质报价在搜索结果中排名靠前,相关商品会获取更多流量,也就是说,赢得更多销售额。

Ozon 根据商品价格、质量和交货速度来确定什么是优质报价。对于能够提供优质报价的卖家,Ozon 提供在搜索引擎中免费推广商品的机制。

Ozon 搜索引擎的目的是什么? #

  • 激励卖家提供优质报价。
  • 帮助卖家向买家展示他们的商品。
  • 帮助买家找到并选择最合适的商品。
  • 在卖家的报价之间分配流量时考虑买家的习惯。

Ozon 搜索引擎工作原理 #

  • 必然性。 搜索引擎总是对卖家或买家的行为作出反应。
  • 无歧视。 搜索引擎对类似情况下不同卖家的一样行为作出相同的反应。
  • 速度。 Ozon 努力使搜索引擎对卖家和买家行为的反应尽可能快。
  • 透明性。 有关 Ozon 搜索引擎工作的所有信息是公开的,Ozon 不影响商品在搜索结果中的排名,也不隐藏相关的影响因素。

Ozon 搜索引擎工作方式 #

买家在 Ozon 网站上进行搜索查询。随后的搜索引擎工作分为几个阶段。

  1. 形成查询和淘汰候选商品的阶段。

    每天,买家在 Ozon 搜索引擎提出数百万次查询。为了帮助每个用户在数以百万计的商品中找到合适自己的商品,在第一阶段,搜索引擎生成 一个较大的候选商品列表。这些候选商品的名称或任何属性中会有买家提出的关键词。对于每个查询,此列表最多可包含 500,000 件商品。

  2. 排名基础层。

    搜索引擎对候选商品进行排序以选择具有最高相关性的 2,000 件商品。

  3. 排名中间层(预训练算法)。

    对于选定的 2,000 件商品,需要估计买家购买每件商品的概率。这些商品的排名取决于买家曾经 重视的特性。为了判断这些特性,Ozon 对比商品特性和买家的行为。结果,每件商品获得从 0 到 1 的分级。

  4. 提升算法

    对于从 0 到 1 排名的 2,000 件商品,应用预定义的提升系数或递减系数。 例如,提升系数会应用于优质卖家的商品,而减低系数会应用于低评级的商品。

  5. 商品展示

    带有结果评级的 2,000 件商品展示在搜索结果中。买家会看见排名的商品页面。

让我们更详细地了解搜索的各个阶段。

第一阶段:形成查询和淘汰候选商品 #

在商品属性中搜索关键词 #

当用户提出查询时,系统开始在搜索数据库包含的所有商品属性和字段中搜索用户的关键词:

  • 商品名称,
  • 商品类别,
  • 品牌,
  • 描述,
  • 颜色、尺寸、材料、类型等属性。

系统检查数百个属性,具体属性取决于商品类别。卖家填写的商品属性越多,找到该商品越容易。

系统检查的内容不包括商品评价和关于商品的问题。这就是说,准确填写商品的属性非常重要: 您注明的属性越多,买家在搜索结果中看见这件商品的可能性越高。

查询转换和标准化 #

在淘汰候选商品之前,搜索引擎会进行一系列查询转换,以免错过合适的商品。转换顺序:

  1. 增加近义词 使查询覆盖更多的商品,例如,查询中有“手机”时,系统也会搜索智能手机。
  2. 查询标准化 查询所有的单词都转换成统一的形式,例如,搜索“Builder Johnson’s Emerald Ship”和搜索“Builder Johnson’s Emerald Ships”时您会获得相同的搜索结果。此外,搜索引擎去除不带有语义信息的单词,例如连词。
  3. 候选商品淘汰 根据剩余的单词,系统从搜索索引中提取包含查询所有关键词的所有商品。如果此类商品太少,则还提取包含至少一个关键词的所有商品。

在这个阶段上,搜索结果最多可包含 500,000 件候选商品,这个列表就被传递到第二阶段。

第二阶段:排名基础层 #

按相关性排序候选商品 #

第二步,系统按内容相关性对候选商品进行排序。在这个阶段,搜索引擎的重点是:

  • 商品与询问之间的文本对应:首先,用普通的线性公式确定查询中 每个单词在商品的字段和属性中的命中次数.然后将每个单词的命中次数相加。
  • 商品评级。在此阶段,商品评级用作提升系数。商品评级越高,提升系数就越大。 提升系数范围从最低评级的 0% 到最高评级的 25%。

结果,所有候选商品都会获得基于内容相关性程度和商品评级的基本相关性评分。

然后,搜索引擎对候选商品进行排序,并将相关性最高的 2,000 件商品列表传递到第三阶段。

第三阶段:排名中间层 #

预训练排名方法的工作原理 #

在这个阶段,搜索引擎需要估计买家最有可能购买 2,000 件产品中的哪些商品。由于购买每件商品的概率是未知的,为了进行商品排名,系统需要预测这个概率。

预测过程分为几个步骤:

  1. 系统计算可能会影响商品购买的所有商品特征(features)。每个特征都是一个实数。例如,商品评级或价格都能作为一个特征。
  2. 一种预训练模型基于特征值来预测销售概率。Ozon 以梯度提升决策树算法作为模型。
  3. 该模型生成用于估计商品购买概率的数值。
  4. 评估购买概率时,系统也考虑到查询的内容。对于不同的查询,相同的商品会有不同的购买概率。

预训练模型的工作原理 #

预训练模型的目的是根据某件商品的特征最准确地预测该商品的销售概率。商品特征包含有关客户曾经购买的商品有哪些特性的信息以及有关需要排名的商品具有其中哪些特性的信息。

基于以前的数据,模型来预测买家的未来行为。例如,有一个特征是某件商品最近 60 天的平均购物车转换率。 对于许多商品来说,转换率不会随着时间而改变。所以,预测购买概率时,模型会考虑到该特征,并且可以说,最近 60 天的转换率越高,模型预测的概率也越高。

其他特征也是如此。例如,在所有其他条件相同的情况下,买家宁愿选择评价多的商品,因此评价越多,模型预测的概率就越高。 此外,不同的特征具有不同的预测能力,并以不同的程度影响购买概率。

模型训练基于一种特殊算法并使用有关商品特征与购买事实之间关系的数据。 由于许多特征基于购买行为,可以说 Ozon 的客户通过他们的行为影响商品在搜索结果中的排名。购买某件商品的事实优先影响该商品的排名,因为特征权重对购买概率的影响程度取决于相关商品的销售历史。

预训练排名方法的影响因素 #

在这个阶段,系统考虑到影响商品销售情况的所有特征:商品规格、评级以及购买行为,例如下订单、查看商品或添加到购物车中等操作。Ozon 搜索引擎总共考虑到 100 个特征左右。

卖家业可以影响到商品在搜索结果中的排名,因为他们直接控制某些特征值。

特征的主要语义块:

  • 流行度 结合了有关商品操作的特征:商品展示次数、添加到购物车和收藏夹中的次数等等。 商品展示是指买家转到商品信息页以及在搜索结果中查看商品的事实。 在现用的搜索模型中,流行度的权重为 29%。
  • 销售量 结合有关商品以前销售情况的特征:销售转化率和商品的购买次数。权重为 17%。
  • 价格 是指基于商品价格计算的特征:某件商品相对于其价格历史的价格更改及折扣金额。权重为 5%。
  • 评论 是指基于商品评级计算的特征:商品评级本身和商品的评价总数。权重为 5%。
  • 运货速度 是指有关运货速度的特征:运货速度本身以及商品是否属于快运货物类别。权重为 3%。
  • 内容相关性 是指有关商品与查询的文本一致性的特征。权重为 12%。
  • 个性化 — 将搜索结果链接到每个单独的买家,同时考虑其购买特征、优先级、兴趣和其他参数。权重为 10%。

由于公式更新和新特征的添加,不同特征的预测能力不断变化。

在这个阶段,搜索引擎给每件商品授予从 0 到 1 的分级。 估计值越接近 1,商品在搜索结果中的位置就越高,其销售的可能性就越大。所有分级被传递到第四阶段。

第四阶段:提升算法 #

在这个阶段,对于从 0 到 1 排名的商品应用预定义的提升系数或递减系数。 例如,提升系数会应用于优质卖家的商品,而减低系数会应用于低评级的商品。

提升算法工作原理 #

例如,分析一下“红袜子”的查询。假设说,经过搜索的前三个阶段,包括预训练排名过程,一个名为“红袜子”的商品获得了 0.7 分级。 如果这是优质卖家的商品,则系统会应用提升系数,例如,乘以1.3。结果,商品的结果分级是 0.91, 而不是 0.7。

提升系数经常变化,因为 Ozon 一直在寻找新的系数来增加网站上的销售总量。

除非提升系数是相互排斥的,它们都被相合起来。例如,分析一下 Ozon 上的一件商品:这是优质卖家出售的、保证次日送达以及价格相当合理的商品。 假设说,每个上述特性的提升系数都是 10%。结果,经过预训练排名得分为 0.7 的商品最终会获得的分级为 0.7 × 1.1 × 1.1 × 1.1 = 0.9317。

提升算法 #

在这个阶段,对于通过排名的商品我们应用以下提升算法:

  • 搜索广告提升 -购买付费搜索排名率。 更多详细信息,请参阅个人帐户中广告→搜索推广 搜索中的促销部分。
  • 与物流相关的提升算法 对于每一件商品,只能应用该类别的唯一一个提升算法。应用顺序如下:
    • Ozon Express 商品。 由于较高的配送速度,系统也会对此类商品应用 7,5% 提升系数。
    • 带有火箭图标的商品。 卖家保证当日或次日从当地仓库送达的商品具有 7.5% 提升系数。
    • 最近的仓库。 离用户最近的Ozon仓库中的商品会获得 3.75% 提升系数。Ozon Global 卖家暂时无法在俄罗斯境内的 Ozon 仓库中存放商品。
  • 优质卖家。 优质卖家的商品获得免费的 5% 提升系数。
  • 优势价格。 若商品价格比其历史价格更低,则价格每降低50%以上其排名率会提高10%。 系统具备正比关系 (价格降低25%,商品排名率会增加5%)。在30天中受提升系数会降低到0%。

提升算法的影响与结果分级 #

提升算法可能不足以超过买家的影响力。

例如,有两件商品,其中经过第三阶段之后一件商品的分级为 0.9,而另一件的分级为 0.6。 在这种情况下,前者在搜索结果中的位置应该比后者高。 如果第二件商品还获得 1.25 的提升系数,则其结果评级为 0.6 × 1.25 = 0.75。 由于其初始评级较低,提升算法无法使这件商品在搜索结果中的位置高于第一件商品。

值得注意的是,等于 0.9 的结果分级可以使商品在搜索结果中排名第一,也可以使商品排名第十,这取决于其他商品 获得的评级。

第五阶段:商品展示 #

商品展示的工作原理 #

  1. 搜索引擎获得带有结果评级的 2,000 件商品。
  2. 根据结果评级,这些商品被展示给买家:评级最高的商品在清单的顶部,评级最低的商品在清单底部。
    • 在 Ozon 网站的桌面版和移动版中,商品以 36 个“卡片”显示在搜索结果页面上。
    • 在移动应用程序中,首先显示前 36 件商品,而向下滚动加载更多商品。
  3. 对于搜索结果中的每件商品,系统会展示有效的规格和图片。

商品在搜索结果中的序数位置会影响其商业指标:转换率、流量和销售量。

如何让产品在搜索结果中更靠前 #

  1. 使用在搜索结果中促销。 您可以通过为必要的搜索查询设定费率来影响商品在搜索结果或目录页面上的序数位置。为此,在个人中心转至 广告→在搜索结果中促销

  2. 降低商品价格 在最近 30 天内价格相对于其平均价格下降的商品在搜索结果中排名更高。 商品的平均价格值随着价格的每次下降会越来越低,因此这种手段的效果会随着时间而减弱。要降低商品价格,请在个人中心转至 价格→商品价格

  3. 收集买家的评价 商品评级越高和买家评价越多,该商品在搜索结果中就排名越靠前。可以向买家为发布评价提供积分。为此,在个人中心转至 更多→促销→评价积分

  4. 填写商品所有属性 商品信息越多,买家越容易会找到它。要编辑商品信息,请转至 商品→编辑商品。您还可以通过 XLS 文件上传来一次编辑多种商品的信息。

常见问题及答案 #

我创建了一件商品并更新了库存。当我点击直接链接时,会打开 Ozon 网站上该商品的信息页,但在搜索结果中这件商品未显示。我应该如何处理? #

新的商品不会立即出现在搜索结果中,通常需要几分钟时间才会显示。此外,由于搜索结果的缓存特点,商品在更改后20分钟内 可能不会出现在搜索结果中。如果20分钟后产品仍未显示在搜索结果中,请检查是否填写了商品的基本信息:价格、名称和描述。 如果商品在 48 小时内还未出现,请联系客服。

当我提出比较合适的查询时,我的商品却未出现在搜索结果中。 #

如果您无法根据具体查询找到商品,可以检查:

  • 商品是否真的未显示在搜索结果中:搜索结果可能包含数千件商品,而您的商品可能在此列表中的任何位置。 为了确保搜索结果中没有您的商品,请应用合适的筛选器,例如按品牌或价格。这样,您会减少样本量。
  • 删除预测类别之后,是否会找到商品。如果类别预测成功,搜索栏下方的标题中会出现 到处搜索 按钮。 在这种情况下,需要检查您的商品是否属于预测的类别以及它是否应该属于这个类别。
  • 该商品是否与其他商品合并成一个共同的商品卡片。请查看商品卡片上有没有属性的不同选项,例如颜色、尺寸或件数。
  • 可不可以按近义词找到商品。

如果完成这些步骤后,商品仍未出现在搜索结果中,请联系 Ozon 客服。

是否可以炒作商品以提升搜索中的排名? #

许多上述指标真的可以炒作。这会是所谓的“白色”手段,例如购买高质量的外部流量,也会是“黑色”手段,例如购买机器人。

重要的是,最终排名还是取决于购买行为,因此您无法通过机器人提高搜索结果中的排名。 例如,您可以通过机器人增加展示次数,但非常大的展示次数却会对商品的排名产生负面影响。因为如果某一件商品展示次数很多,但购买次数很少,这意味着买家还是不喜欢这件商品。 因此,通过炒作展示次数,您可以降低商品的排名。

点击不会影响排名,而且对于添加到购物车和收藏夹中的操作我们应用反欺诈系统,以跟踪炒作的指标而避免在排名时使用它们。 同时,我们不惩罚作弊的卖家,因此不可能通过炒作指标来降低竞争商品的排名。