Genecos

スコア算出方法

最終更新: 2026年4月24日

スコアの概要

Genecosの類似度スコア(0〜100点)は、2つの商品の「成分の重なり方」を数値化したものです。 スコアが高いほど成分構成が似ていることを意味します。

スコアは価格・ブランド・容量・効果の主観評価を反映しません。 あくまでも成分表記に基づく客観的な指標です。

成分正規化

スコア算出の前に、以下の正規化処理を行います:

  1. JCIA名への統一
    「ヒアルロン酸Na」「ヒアルロン酸ナトリウム」「Sodium Hyaluronate」などの 表記揺れを、JCIA(日本化粧品成分表示名称)の標準名称に統一します。
  2. 別名・英語名の解決
    INCI(国際化粧品原料命名法)名と日本語名のマッピング辞書を用いて、 別名・英語名・略称を同一成分として扱います。
  3. 表記ゆれの吸収
    全角/半角、大文字/小文字、括弧・スペースの差異を正規化します。

スコア算出アルゴリズム

正規化後の成分リストを用いて、以下の要素を組み合わせてスコアを算出します:

  • 成分重複率(基本スコア)
    共通成分数 ÷ ユニーク成分の総数(Jaccard係数に近い考え方)
  • 有効成分ボーナス
    機能的に重要な成分(有効成分・特徴成分)が一致する場合に加点
  • 成分順序の近さ
    成分表は配合量の多い順に記載される慣例があります。 上位成分の一致度が高い場合に加点
  • 注意成分ペナルティ
    片方にのみ特定の注意成分が含まれる場合に減点

算出には独自の重み付けを行っており、アルゴリズムのバージョンは内部で管理されています。 バージョンが変わった場合はスコアが変化することがあります。

スコアの限界

  • 成分の配合濃度は成分表から読み取れないため、スコアに反映されません
  • 成分の処方技術(カプセル化・安定化など)はスコアに含まれません
  • スコアが高くても、使用感・テクスチャー・香りは異なる場合があります
  • 成分データが不足している商品のスコアは信頼性が低くなります

バージョン管理

スコアには算出時のアルゴリズムバージョン(例: v2.1)が内部で記録されます。 アルゴリズムを改善した場合は全商品を再スコアリングします。 比較ページには生成時のバージョン情報が保持されます。