スコア算出方法
最終更新: 2026年4月24日
スコアの概要
Genecosの類似度スコア(0〜100点)は、2つの商品の「成分の重なり方」を数値化したものです。 スコアが高いほど成分構成が似ていることを意味します。
スコアは価格・ブランド・容量・効果の主観評価を反映しません。 あくまでも成分表記に基づく客観的な指標です。
成分正規化
スコア算出の前に、以下の正規化処理を行います:
- JCIA名への統一
「ヒアルロン酸Na」「ヒアルロン酸ナトリウム」「Sodium Hyaluronate」などの 表記揺れを、JCIA(日本化粧品成分表示名称)の標準名称に統一します。 - 別名・英語名の解決
INCI(国際化粧品原料命名法)名と日本語名のマッピング辞書を用いて、 別名・英語名・略称を同一成分として扱います。 - 表記ゆれの吸収
全角/半角、大文字/小文字、括弧・スペースの差異を正規化します。
スコア算出アルゴリズム
正規化後の成分リストを用いて、以下の要素を組み合わせてスコアを算出します:
- 成分重複率(基本スコア)
共通成分数 ÷ ユニーク成分の総数(Jaccard係数に近い考え方) - 有効成分ボーナス
機能的に重要な成分(有効成分・特徴成分)が一致する場合に加点 - 成分順序の近さ
成分表は配合量の多い順に記載される慣例があります。 上位成分の一致度が高い場合に加点 - 注意成分ペナルティ
片方にのみ特定の注意成分が含まれる場合に減点
算出には独自の重み付けを行っており、アルゴリズムのバージョンは内部で管理されています。 バージョンが変わった場合はスコアが変化することがあります。
スコアの限界
- 成分の配合濃度は成分表から読み取れないため、スコアに反映されません
- 成分の処方技術(カプセル化・安定化など)はスコアに含まれません
- スコアが高くても、使用感・テクスチャー・香りは異なる場合があります
- 成分データが不足している商品のスコアは信頼性が低くなります
バージョン管理
スコアには算出時のアルゴリズムバージョン(例: v2.1)が内部で記録されます。
アルゴリズムを改善した場合は全商品を再スコアリングします。
比較ページには生成時のバージョン情報が保持されます。
関連ポリシー