• TOP
  • ブログ
  • 【2026年版】t検定とは?やり方・Excel関数(T.TEST)・結果の見方を例題付きで徹底解説
 

blog
診断・ヒアリングDXブログ

【2026年版】t検定とは?やり方・Excel関数(T.TEST)・結果の見方を例題付きで徹底解説

SHARE

  • Twitter
  • Facebook
  • Hatena
  • Pocket
  • LINE

目次

「2つの数値を比べたら片方の平均が大きかったから施策が効いた」

安易にこのような判断をしていませんか?。

実は、その差がサンプルの偏りや偶然のばらつきで出ているだけのことも珍しくありません。

意思決定の前に「その差が偶然か、意味のある差か」を判定するのがt検定です。

本記事では、t検定の3種類の使い分け、ExcelのT.TEST関数と分析ツールでのやり方をコピペで使える例題付きで解説し、結果の見方・書き方・よくある誤解までこの1記事で完結します。

この記事を読み終えるころには、アンケート分析やA/Bテストの結果を自信を持って判断できるはずですので、ぜひ参考にしてください。

著者:Interviewz編集部(運営:LEARNERZ株式会社)

ヒアリングDXツール「Interviewz」を累計5,000社以上で提供。リード数268%向上・ヒアリングコスト90%削減・サポートコスト半減の実績をもとに、アンケート設計と統計分析の知見を発信しています。

t検定とは?「平均の差が偶然かどうか」を判定する分析

t検定とは、2つの平均値の差が「偶然によるものか」「判断に使ってよい差と言えるのか」を統計的に検証する分析手法です。平均値の大小をそのまま比べるのではなく、データのばらつきとサンプル数を踏まえたうえで信頼性を判断します。

なぜ平均だけ見ると判断ミスが起きるのか?

たとえばA案とB案のクリック率の平均がそれぞれ12%と15%だったとします。「B案のほうが3ポイント高いから採用」と判断して良いのでしょうか。

答えは「サンプル数とばらつき次第」です。サンプルが各5件ずつしかなければ、3ポイントの差は単なる偶然である可能性が極めて高くなります。t検定はこの「偶然か否か」を確率で示してくれるため、感覚的な比較を根拠ある判断に変換できます。

加重平均と組み合わせて使うことも多く、両者の役割は加重平均の計算方法|やり方・Excel関数・活用事例6選でも整理しています。

他の検定との違い(分散分析・カイ二乗検定)

似た検定との使い分けは下記のとおりです。

検定手法 比較対象 主な用途
t検定 2群の平均値の差 A/Bテスト、施策前後の比較
分散分析(ANOVA) 3群以上の平均値の差 3パターン以上のA/Bテスト
カイ二乗検定 カテゴリデータの比率の差 男女別・年代別の構成比比較

t検定は「2群の平均比較」専用と覚えておけば、検定の選択ミスは大きく減ります。3群以上を比較したい場合は分散分析、構成比なら カイ二乗検定が定番です。

t検定の3種類と使い分け|対応あり/対応なし/Welch

t検定には大きく3種類あり、データの取り方によって使い分けます。最初にどれを選ぶかで結論が変わるため、ここで間違えないようにしましょう。

種類 使う場面
対応のあるt検定 同じ対象を2回測定したデータ 同じ人の施策前後の体重・スコア
対応のないt検定(Studentのt検定) 独立した2群、分散がほぼ等しい A組とB組のテスト点数
Welchのt検定 独立した2群、分散が異なる 投入予算が違うキャンペーンのCV率

判断基準はシンプルで、「2つのデータが1対1で結びついているか」だけです。同じ対象の2回測定ならYes(対応あり)、別々の対象同士の比較ならNo(対応なし)になります。

対応のあるt検定(同じ対象の2回測定)

施策実施前と実施後、テスト前とテスト後など、同じ対象から2回データを取った場合に使います。ペアごとの差に注目するため、個体差の影響を打ち消せる点が強みです。

重要ポイント
施策実施前後の売上 同じ顧客の前後比較
研修前後のテストスコア 同じ受講者の習得度測定
サプリメント摂取前後の体重 同じ被験者の効果検証

対応のないt検定(Studentのt検定)

独立した2つのグループの平均を比べるときに使います。各グループ内のばらつきを考慮しながら、平均差の信頼性を判定します。両グループの分散がほぼ等しい場合に使います。

重要ポイント
A組とB組のテスト平均 クラスが違う=対応なし
新サービスを使ったユーザーと使わなかったユーザーの満足度 ランダム割り当てが理想

Welchのt検定(分散が異なる場合)

対応のないt検定の発展形で、2群の分散が大きく違う場合でも安全に使える検定です。「分散が等しいかどうか分からないなら、最初からWelchを使う」というのが近年の標準アプローチです。

Excelでも分析ツールから「t検定:分散が等しくないと仮定した2標本による検定」として選択できます。アンケートで5段階評価のスコアを比較する場面については、アンケートの5段階評価とは?活用法やメリット・デメリットも参考になります。

 

3種類の使い分けは整理できましたが、いざ実務で動かしてみると「そもそも検定に耐えうるサンプル数を確保できない」という壁にぶつかるケースがほとんどです。回答数を底上げする最短手段の一つが、回答インセンティブとしてのデジタルギフト施策です。

▼サンプル数を確保して検定の信頼性を高めたい方はこちら

👉 【無料DL】回答率を底上げする|デジタルギフト付きアンケート活用資料

ExcelのT.TEST関数でt検定を行う方法【コピペOK】

最も手軽なのがT.TEST関数を1セルで使う方法です。p値だけが返ってくるため、「有意かどうか」だけ判定したい場合に最適です。Googleスプレッドシートでも同じ式で動きます。

T.TEST関数の書式

=T.TEST(配列1, 配列2, 検定の指定, 検定の種類)

それぞれの引数は次のとおりです。

引数 設定値 意味
配列1 データ範囲A 1つ目のデータ群
配列2 データ範囲B 2つ目のデータ群
検定の指定 1:片側検定/2:両側検定 通常は2(両側)を選択
検定の種類 1:対応あり/2:等分散の対応なし/3:Welch 取得方法と等分散性で選択

例題①|対応ありt検定(朝晩の体重)

ある5人の朝と夜の体重を測定したとします(kg)。

被験者 朝(A列) 夜(B列)
1 60.2 60.8
2 55.4 56.1
3 72.1 73.0
4 48.7 49.2
5 66.3 67.0

このデータをA2:A6、B2:B6に入力し、以下の式を入れます。

=T.TEST(A2:A6, B2:B6, 2, 1)
→ 結果:約0.0006(p値)

p値が0.05を大きく下回るため、朝と夜の体重には統計的に有意な差があると判断できます。

例題②|対応なしt検定(A組とB組のテスト)

A組(B列)とB組(C列)のテスト点数で平均差を検定するケースです。

生徒No A組 B組
1 78 82
2 65 71
3 88 84
4 72 79
5 81 86
=T.TEST(B2:B6, C2:C6, 2, 3)
→ 結果:約0.26(p値)

p値が0.05を超えているため、両組の平均点差は統計的に有意ではない(偶然の範囲内)と判断します。

回答データをGoogleフォームで収集してExcelで分析する流れはGoogleフォーム回答通知の受け取り方|4ステップも参考になります。

 

T.TEST関数で計算自体は1セルで完結します。残る課題は、検定にかける前のアンケート設計と回答率です。設問文・選択肢・配信導線を少し変えるだけで、回答数と回答品質は大きく変わります。

▼有意差を出せるアンケートを設計したい方はこちら

👉 【無料DL】ユーザーからの回答率が高いアンケートの作り方【6つのコツ】

Excel分析ツールでt検定を行う方法と結果の見方

p値だけでなくt値・自由度・境界値まで出して資料に載せたい場合は、Excelの分析ツールを使います。論文・レポート・社内提案資料で根拠を明示する場面に向きます。

事前準備|分析ツール(アドイン)を有効化する

「ファイル」→「オプション」→「アドイン」→「Excelアドイン」→「設定」→「分析ツール」にチェックでOKです。リボンの「データ」タブに「データ分析」が追加されれば準備完了です。

実行手順3ステップ

STEP 操作内容
1 「データ」→「データ分析」→検定種類を選択(対応あり/等分散/Welch)
2 変数1・変数2の入力範囲、仮説平均との差異(通常0)、α(通常0.05)を入力
3 出力先を指定して「OK」→t値・自由度・p値・境界値が表示される

結果の見方|押さえるべきは「t値」と「P(T<=t)両側」

分析ツールの出力では、次の項目に注目します。

項目 意味 判断基準
平均 各群の平均値 差の方向(どちらが大きいか)を確認
t値 検定統計量 境界値より絶対値が大きければ有意
自由度 サンプル数に基づく値 報告書に記載
P(T<=t) 両側 p値(両側検定) 0.05未満なら有意差あり
t 境界値 両側 棄却域の境界値 t値の絶対値と比較

結果は「P(T<=t)両側が有意水準(通常0.05)を下回るか」を最優先で確認します。これを満たせば「統計的に有意な差がある」と結論できます。

分析結果を社内資料にまとめる際の手法はヒアリングやアンケート結果の調査資料をパワポで作成する方法も参考になります。

 

分析ツールでt値・自由度・p値まで揃えば、論文・社内レポートにそのまま添付できます。ここから先は「何を、誰に、どう聞くか」というリサーチ設計の精度が結果の意味を決めます。マーケティングリサーチで成果につながるヒアリングの型はガイドに整理しています。

▼分析対象を取り違えないリサーチ設計をしたい方はこちら

👉 【無料DL】ヒアリングシート作成ガイド(マーケティングリサーチ編)

 p値と有意水準の正しい読み方|よくある誤解5つ

t検定の誤用の大半は、p値の解釈ミスから生まれます。実務で特に多い5つの誤解を整理します。

誤解1|p値は「差が出る確率」ではない

p値は「帰無仮説(差がない)が正しいと仮定したときに、今回のデータが得られる確率」です。「差が出る確率」「仮説が正しい確率」とは別物です。

誤解2|p値が0.05超で「差がない」と断定するのは誤り

正しくは「今回のデータからは有意差を確認できなかった」と表現します。サンプル数不足や検出力の問題で有意差が出ないだけのケースも多く、「差がない」と断言するのは統計的に誤りです。サンプルサイズの設計についてはアンケートの有効回答数とサンプルの重要性、回答率の高め方5つもご覧ください。

誤解3|有意差≠重要な差(効果量を併記する)

サンプルが大量にあれば、ごく小さな差でもp値は有意になります。逆に統計的に有意でも、実務的にはほぼ無視できる差ということもよくあります。p値だけでなく**平均差の大きさ(効果量)**も必ず併記しましょう。

誤解4|多重比較の問題

「複数の比較を同時に行うと、本当は差がなくても有意になりやすい」現象です。何度もt検定を回せばいつかは0.05を下回るため、3群以上比較するときは分散分析やBonferroni補正を使います。

誤解5|正規性・等分散の前提

t検定は理論上、データが正規分布に従うことを仮定します。サンプル数が30以上あれば中心極限定理で多くの場合は問題ありませんが、極端に偏った分布の場合はノンパラメトリック検定(Mann-Whitney U検定など)が安全です。

 

p値の誤解を避けるカギは、分析以前の「設計段階」にあります。サンプルサイズ、設問構成、想定する効果量を最初に決めておけば、結果の解釈ブレはほぼ起きません。同業他社の実例から逆算するのが近道です。

▼成果を出している企業の設計事例を見たい方はこちら

👉 【無料DL】ヒアリング&診断コンテンツの実例集

t検定の結果の書き方|論文・レポート用テンプレ

t検定の結果をレポート・論文・社内資料に書くときは、「何を比較し、どの検定で、p値はいくつで、結論は何か」の順で書くと読み手が迷いません。

書き方の基本構成

要素 記述内容
1. 何を比較したか 「A群とB群の平均CV率を比較した」
2. どの検定を使ったか 「Welchのt検定を実施した」
3. 結果(数値) 「t値=2.43, 自由度=48, p=0.019」
4. 結論 「有意水準5%で有意な差が認められた」
5. 実務的意味づけ 「B群のCV率がA群より2.1ポイント高く、施策効果ありと判断」

コピペで使える文章テンプレート

A/Bテストの結果報告例

「A群(n=120)とB群(n=125)のCV率についてWelchのt検定を実施した結果、t値=2.43、自由度=48、p=0.019であり、有意水準5%で有意な差が認められました(B群が平均2.1ポイント高い)。したがって、B案を採用する判断材料として有効です。」

施策前後の比較報告例

「施策実施前後の同一ユーザー50名のNPSスコアについて対応のあるt検定を実施した結果、t値=4.12、自由度=49、p<0.001で有意な差が認められました(平均差+0.8ポイント)。施策がNPS向上に寄与したと判断できます。」

有意差が出なかった場合の書き方

「A群とB群の平均クリック率を対応のないt検定で比較した結果、p=0.18であり、有意水準5%で有意な差は確認できませんでした。差がない可能性に加え、サンプル数(n=各30)が小さく検出力が不足している可能性もあるため、追加検証を推奨します。」

タッチポイント別の評価分析にも応用できます。詳しくはタッチポイントの評価に効果的なアンケートの作り方と改善方法もご覧ください。

 

報告テンプレまで揃えば、t検定をルーティン業務に組み込めます。あとは「設計→配信→回答収集→集計→分析→次の打ち手」のサイクルをどれだけ短くできるかが勝負どころで、ノーコードのヒアリングツールでこのループを最短1日に短縮できます。

▼分析の前後工程をまるごと効率化したい方はこちら

👉 →【無料DL】Interviewzサービス概要資料

よくある質問(FAQ)

Q1. t検定はサンプル数が何個から使えますか?

理論上は1群あたり2個から計算可能ですが、信頼できる結論には1群あたり最低15〜30個程度を推奨します。サンプルが少ないと正規性の前提も崩れやすいため、Mann-Whitney U検定などノンパラメトリック検定への切り替えも検討してください。

Q2. p値が0.05を超えたら「差がない」と言ってよいですか?

いいえ。正しくは「今回のデータからは有意な差を確認できなかった」と表現します。サンプル数不足や検出力の問題で有意差が出ないケースが多く、「差がない」と断定するのは統計的に誤りです。

Q3. t検定とWelchのt検定はどう違いますか?

通常のt検定(Studentのt検定)は2群の分散が等しいことを前提とします。Welchのt検定は分散が異なる場合でも使えるよう調整された検定で、実務では等分散の判定が難しい場面が多いため、最初からWelchを使う運用も一般的です。

Q4. ExcelとGoogleスプレッドシートでt検定の結果は同じになりますか?

はい、関数仕様は基本的に同じです。T.TEST(配列1, 配列2, 検定の指定, 検定の種類) でGoogleスプレッドシートでも同じ結果が得られます。ただしGoogleスプレッドシートには「データ分析」ツールがないため、t値・自由度まで欲しい場合はExcelの分析ツールを使うのが効率的です。

Q5. t検定の前にF検定はやるべきですか?

従来は「F検定で等分散判定→等分散ならStudent/分散が異なるならWelch」と段階を踏みましたが、近年は最初からWelchのt検定を使うアプローチが推奨されつつあります。F検定自体もサンプル数や正規性の影響を受けるため、二段階検定の信頼性は限定的です。

あわせて読みたい関連記事

まとめ|t検定はアンケート・A/Bテスト分析の標準ツール

t検定は、平均差が「偶然か、意思決定に使ってよい差か」を判定するための統計手法です。本記事の要点を整理すると次のとおりです。

  • t検定は2群の平均差専用。3群以上なら分散分析、構成比ならカイ二乗検定
  • 種類は3つ:対応あり/対応なし(Student)/Welch。データの取り方で使い分ける
  • Excelは=T.TEST(配列1, 配列2, 2, 検定の種類)で1セル完結。Googleスプレッドシートも同じ式
  • 結果はP(T<=t)両側<0.05で有意差ありと判定。t値・自由度も併記
  • p値は「差が出る確率」ではない。有意差≠重要な差で、効果量を必ず併記する

t検定を正しく使えば、A/Bテスト・施策効果検証・アンケート分析などで、感覚に頼らず数値根拠で意思決定できるようになります。

そして、設計から集計・分析まで一気通貫で運用したいフェーズに入ったら、Interviewzのようなノーコードのヒアリングツールへの移行が効率的です。アンケート設計から条件分岐、CRM連携までを最短1日で導入でき、14日間は全機能を無料でお試しいただけます。

Webヒアリング全体の進め方を学びたい方はWebヒアリングとは?やり方5ステップ・質問テンプレもあわせてご覧ください。

t検定を「単発の作業」ではなく「意思決定の標準フロー」に組み込めれば、A/Bテスト・施策効果検証・顧客理解の精度は一段上がります。データ収集から分析まで一気通貫で運用したい段階に来た方は、まずは触ってみるのが最短です。

▼14日間すべての機能を試したい方はこちら

👉 【無料】Interviewz 無料トライアルに申し込む

▼導入前に機能・料金・事例をまとめて確認したい方はこちら

👉 【無料DL】Interviewzサービス概要資料

Interviewz(インタビューズ)では、ヒアリング体験をDX化し、質の高い情報をスピーディーに収集、顧客・ユーザー理解を深め、サービスのあらゆるKPIの改善を可能にします。テキストタイピングを最小化した簡単かつわかりやすいUI/UXと、収集した声をノーコードで様々なシステムに連携し、ユーザーの声を様々なビジネスプロセスで活用することで、よりビジネスを加速させることが可能です。

Interviewz(インタビューズ)をご活用いただくことで以下のことが解決できます。

• 新規お問い合わせ、相談数の向上
• ヒアリングの内容の最適化から受注率の向上
• ヒアリングコスト(人件費・タイムコスト)の削減
• 既存顧客のお問い合わせのセルフ解決(サポートコストの削減)
• サービス/プロダクトのマーケティングリサーチ
• 既存顧客、従業員のエンゲージメント向上
• データ登録負荷の軽減
• サイトにおけるユーザーの行動情報のデータ蓄積

Interviewzをご利用いただいた多くのお客様で、ビジネスによけるあらゆるKPIの数値改善を可能にしています。

▼Interviewz(インタビューズ)の主な活用方法

• 総合ヒアリングツール
• チャットボット
• アンケートツール
• カスタマーサポートツール
• 社内FAQツール



Interviewzの機能一覧|総合的なヒアリング活動を網羅


Interviewzでは、下記のような総合的なヒアリング活動を支援する機能を揃えております。

以下では、まずはInterviewz(インタビューズ)を使って操作性や機能を確かめたい方向けに、無料でInterviewzをデモ体験いただくことが可能です。気になる方はぜひご体験ください。

ヒアリングDX・アンケートのデジタル化のご相談は下記より日程をご調整ください。

こちらの記事もオススメです