卒論=技術文書の書き方(5)
2.3 論文のフォーマット
論文を作成する際には、単に内容が正確であればよいというわけではなく、フォーマット(書式)も学術的な基準に沿って統一することが求められます。フォーマットを整えることは、研究内容を正しく、かつ読みやすく伝えるための基本的なマナーであり、査読者や読者にとって理解しやすい文書作成につながります。本章では、論文フォーマットの基本的な要素についてまとめます。
2.3.1 全角文字と半角文字
ワープロ文書では、全角文字 (例:ア、イ、ウ)と 半角文字 (例:ア, イ, ウ)があります。和文論文においては次のようなルールが一般的です。
- 和文の文字(漢字、ひらがな、カタカナを含む)や句読点、カッコは全角を使用する。
- 欧文表記、数式、数字、変数、単位は半角を使用する。
- 単位にカッコを用いるときも、そのカッコは半角で記す。
特に句読点に関しては注意が必要です。工学系の学術誌では 「, (カンマ)」と「. (ピリオド)」 が多く採用されています。一方で、文部科学省検定教科書や多くの和文書籍では 「、(てん)」と「。」(まる) が使われています。執筆先の卒論集や学術誌がどちらを採用しているのかを必ず確認し、それに従う必要があります。
パソコンの入力システムは句読点を自動変換してしまうことがあります。そのため、文書完成後に一括変換で統一することが推奨されます。ただし、一括変換は見出しや特定の記号まで変換してしまう場合があるため、必ず個別にチェックすることが重要です。
2.3.2 数式の記載方法
論文において数式は欠かせない要素ですが、その書き方にも明確なルールがあります。
- 変数や量記号:半角のイタリック体(斜体)
- 数字や数学記号(=、+、−など)、単位:半角のローマン体(立体)
数式の書き方には以下の二通りがあります。
- 本文中に数式を挿入する方法
- 数式を一文として独立させる方法
どちらを選んでも構いませんが、論文全体で統一することが求められます。
例 2.72
【式を文の中に入れる】
抵抗 $R \,[\Omega]$ に電流 $I \,[A]$ が流れるとき、抵抗の端子電圧 $E \,[V]$ は次式で表される。
【式を文として扱う】
試料のヤング率 $E \,[Pa]$ を式 (2) より求める。
ここで $\sigma \,[Pa]$ は応力、$\varepsilon$ はひずみである。
このように、同じ記号 であっても文脈や分野によって異なる物理量を表すことがあります。そのため、数式で用いる量記号や変数は必ず本文で説明することが必要です。また、単位を数式に直接含めても構いませんが、本文中で説明を補足した方が読みやすくなります。
数式の配置は一般的に 中央揃え または 左インデントをつける方法 が用いられます。さらに、数式には式番号(例:(1))を付与し、本文中では「式(1)」のように参照します。「(1)式」とは書かない点に注意が必要です。
2.3.3 数値と単位の表記
論文では数値と単位の表記に厳密なルールがあります。特に重要なポイントは以下の通りです。
- SI単位系および例外単位(JIS Z8203:2000に規定)を用いる。
- 数値と単位の間には半角スペースを入れる(例:「3 km」と記す。誤りは「3km」)。
- 単位は一つの語として扱うため、「m/s」と記し、「m / s」とはしない。
- 接頭語(k, m, μ など)は小文字で表記し、文頭であっても大文字にしない。
- 国際規格 ISO80000 では、数値の後の単位にカッコは不要。
例 2.73
【誤りの例】
気温摂氏20度, 湿度80%, 向かい風 5 (m/s) でのドローンの最高速度は 20Km/h であった。
【正しい例】
気温 20 ℃, 湿度 80 %. 向かい風 5 m/s でのドローンの最高速度は 20 km/h であった。
単位表記には学術誌や書籍ごとに異なる流儀があります。例えば:
- 文部科学省検定教科書:変数には [ ] を付けるが、数値には付けない(例:, 3 kHz)
- 和文教科書や学術誌:数値や変数にブラケットを付けることが多い(例:, 3 [m])
- 欧文教科書や学術誌:カッコを付けずに表記(例:3 kPa)
また、%(パーセント記号)は単位ではなく記号であるため、括弧を付けずに直接書く必要があります。
例 2.74
【誤りの例】
45.6 [%]
【正しい例】
45.6%
2.3.4 見出し
論文の見出し(章・節・項など)のフォーマットは、提出先の学術誌や卒論集の規定に従う必要があります。一般的には以下のような形式が用いられます。
例 2.75
○○○○ (ゴシック 10 pt。行の前を1行空ける)
2.1 ○○○○ (明朝 10 pt)
2.2.1 ○○○○ (1文字下げて、明朝 9 pt)
(1) ○○○○ (2文字下げて、明朝 9 pt)
(本文。段落の先頭は1文字下げて、明朝 9 pt)
このように、番号を全角か半角で記すのか、数字の後にピリオドを置くのかスペースを置くのかなど、細かいルールがあります。必ず規定を確認し、統一することが求められます。
2.3.5 フォント・ポイント
論文ではフォントと文字サイズも重要です。和文論文では明朝体が基本とされます。明朝体は縦線が太く、横線が細いデザインであり、小さい文字サイズでも読みやすい特徴を持つため、書籍や新聞で広く使用されています。
一方、ゴシック体はすべての線がほぼ同じ太さにデザインされており、視認性が高いためWebページやスマートフォンでの利用に適しています。ただし細かい文字サイズでは読みづらくなるため、論文本文には不向きです。
学会の予稿や学術誌の原稿作成では、投稿規定で指定されたフォントを必ず使用する必要があります。指定がない場合には、MS明朝などの等幅フォントを用いると良いでしょう。等幅フォントでは全角と半角の幅の比率が安定しており、編集作業が容易になる利点があります。これに対して、文字幅が文字ごとに異なるフォントはプロポーショナルフォントと呼ばれます。
等幅フォントとプロポーショナルフォントの比較
- 【MS 明朝】 等幅フォントとプロポーショナルフォントの比較です。
- 【MSP 明朝】 等幅フォントとプロポーショナルフォントの比較です。
等幅フォントを使うことで横方向の文字数や位置を整えやすくなり、編集効率が向上します。ただし、禁則処理(行頭にカンマやピリオドを置かないなど)が働く場合には文字位置がずれることもあるため注意が必要です。
ポイント(文字サイズ)
文字サイズは「ポイント(pt)」という単位で表されます。論文本文は一般的に 9 pt が基本です。学術誌や学会の指定がある場合には、それに従ってフォントサイズを統一することが重要です。
2.4 統計検定
本節では、実験や測定結果をどのように解釈し、研究成果として示すかを考えるために必要な「統計検定」について解説します。実験データには必ずばらつきが存在し、そのばらつきを適切に扱うことが科学的な結論を導く上で重要です。ここでは、母集団と標本の関係、分散や正規分布、標準偏差や標準誤差といった基本概念を確認した上で、t検定やχ²検定といった代表的な統計検定法について学びます。
2.4.1 なぜ統計を用いるのか
研究においては、開発した材料やデバイスの性能を測定し、その有効性を予測することが重要です。しかし、どれだけ丁寧に試作・測定しても、すべての試料が全く同じ特性を示すことはありません。
- 材料をカットすれば長さに数十 μm のばらつきが生じる
- 表面をクリーニングすれば残存する酸化物の量に μg 単位のばらつきが生じる
- 接続すれば接触抵抗が数 mΩ 程度ばらつく
このようなばらつきは不可避です。したがって、実験の目的は「たまたま優れた結果が出たかどうか」を示すのではなく、少数のサンプルから母集団全体の傾向を予測することにあります。そのために統計的な手法が必要となります。
2.4.2 母集団とは
実験では数個から十数個程度の試料しか測定できませんが、理論的には数千、数万の試料が存在すると考えられます。この「多数の集まり」を 母集団 と呼びます。
実際に測定する試料は母集団から取り出したごく一部にすぎません。この一部を 標本(sample) と呼びます。研究の目的は、標本から得られた情報を用いて母集団の性質(平均値や分散など)を推定することにあります。
2.4.3 平均値だけではわからない
単純に平均値だけを比較しても、差があるかどうかを結論づけることはできません。
例 2.47
陽極 A と陽極 B を用いた電池の放電容量を比較した結果、平均値ではBの方がやや大きいように見える。しかし、グラフ(図2.4)を見ると、外れ値を除けば両者に大きな差はないように見える。
一方、もしデータが図2.5のように得られた場合は、平均値だけでなくばらつきも小さいため、「Bが優れている」と言えるかもしれない。
👉 ここから分かるのは、平均値の比較だけでは不十分であり、データのばらつき(分散)も考慮する必要があるということです。
2.4.4 分散
データのばらつきを表す基本的な指標が 分散 です。
n 個の標本データを $x_1, x_2, \dots, x_n$、標本平均を $\bar{x}$ とすると、標本分散 $s^2$ は次の式で表されます。
分散は「平均値からどの程度離れているか」の2乗平均を表し、値が大きいほどデータのばらつきが大きいことを意味します。
2.4.5 正規分布
人工物を多数製造した場合、その特性値はしばしば 正規分布 に従います。正規分布の確率密度関数は次のように表されます。
ここで、$\mu$ は母平均、$\sigma^2$ は母分散です。正規分布は $N(\mu, \sigma^2)$ と表記します。
例として、平均値と分散が異なる2つのデータセットを比較すると、分散が大きいほど分布の幅が広がり、重なりも大きくなることがわかります(図2.6、図2.7)。
2.4.6 サンプルから母集団を推定する
母平均 $\mu$ や母分散 $\sigma^2$ は理論的には母集団すべてを測定しなければ求められません。しかし、実際には標本平均 $\bar{x}$ や標本分散 $s^2$ から推定します。
ただし、標本分散は母分散より小さくなる傾向があります。その補正として、分母を $n$ ではなく $n-1$ とする 不偏分散 を用います。
ここで を 自由度 と呼びます。
2.4.7 標準偏差
不偏分散 の平方根を 不偏標準偏差 と呼び、母集団のばらつきを表す推定値として使います。これが一般に知られる 標準偏差(SD) です。
正規分布の性質として、次のような確率分布が成り立ちます。
- 平均値 ± SD の範囲にデータの 68.3% が含まれる
- 平均値 ± 2SD の範囲にデータの 95.5% が含まれる
これにより、標準偏差を用いれば、測定値のおおよその分布範囲を推定できます。
2.4.8 母集団から取り出したサンプルの平均値
母集団が正規分布 $N(\mu, \sigma^2)$ に従うとき、そこから $n$ 個のサンプルを取り出して平均値を計算すると、その平均値の集団も正規分布に従います。このとき、分散は母分散を n で割った値になります。
2.4.9 t 分布
平均値の集団は、母分散 $\sigma^2$ を直接知ることはできないため、不偏分散 を代わりに用いて、$\sigma^2$を\sqrt{u^2}に置き換えると、正規分布とは若干異なる分布を示します。これを t分布 と呼びます。
t分布はサンプル数が少ないとすそ野が広くなり、サンプル数が増えるほど正規分布に近づきます。自由度が10を超えると正規分布との差は小さくなります。
2.4.10 標準誤差
標本平均 $\bar{x}$ のばらつきを示す指標が 標準誤差(SE) です。不偏標準偏差 $u$ を用いると、次式で表されます。
標準誤差は「母平均に対する標本平均の推定精度」を示す値です。
2.4.11 標準偏差と標準誤差の違い
- 標準偏差(SD):データそのもののばらつきを表す
- 標準誤差(SE):標本平均の推定精度を表す
論文においては、工学的な観点から「平均値 ± SD」を示すことが望ましいとされています。なぜなら、製品の品質はデータのばらつきを抑えることによって保証されるためです。平均値だけ良くても、ばらつきが大きければ品質の高い製品とはいえません。
2.4.12 データの比較
検定の目的と種類
- 条件を変えて製作した2種類のアイテムの特性に差があるかどうかを統計検定を用いて調べる
- 特性値は正規分布を示すため、パラメトリック検定を用いる
- 代表的なパラメトリック検定であるt検定(student's t-test)を説明する
帰無仮説の考え方
- 証明したいこと:二つの母集団の平均値は等しくない(μ1≠μ2)
- まず「それぞれの母集団の平均値は等しい(μ1=μ2)」との帰無仮説を立てる
- 「差がある」ためには「差がない」との仮説を否定(棄却)する
t検定の手順と判定基準
- 帰無仮説が正しい場合に、得られた平均値の差(Xm1-Xm2)が出現する確率(p値)を計算する
- p値が低いほど「『差がない』との仮説を信じるべき確率」が下がる
- 有意水準(5%(p=0.050)または1%(p=0.010)を設定
- p値が有意水準を下回ったとき:
- 「帰無仮説は棄却された」
- 「有意な差がある」とみなす
- 有意水準は帰無仮説が正しいのに棄却する誤りの基準であるため、危険率とも呼ばれる
2.4.13 t検定の例
例として、陽極 A と B の電池の放電容量を比較します。
- 測定例1(図2.9):平均値に差があるように見えるが、t検定の結果 で有意差なし。
- 測定例2(図2.10):ばらつきが小さく、t検定の結果 $p = 5.6 \times 10^{-3}$ で有意差あり。
t検定のExcel関数は以下のように記述します。
T.TEST(配列1, 配列2, 尾部, 検定の種類)
- 配列1, 配列2:比較するデータ
- 尾部:片側検定なら1、両側検定なら2(通常は2)
- 検定の種類:1=対応のあるt検定、2=等分散、3=非等分散(通常は3)
2.4.14 サンプル数について
統計検定を行う際、サンプル数の設定は重要です。途中でサンプル数を増やして有意差が出た時点で止めるのは「データねつ造」にあたります。あらかじめ必要なサンプル数を決め、その数を測定した上で検定を行う必要があります。
2.4.15 2値変数の比較(χ²検定)
検定の目的
- 成功/失敗、良/不良などの2値変数を比較する場合に用いる。
- 例:二つの顔認識アルゴリズムAとBの認証成功率に差があるかどうかを調べる。
帰無仮説の考え方
- 証明したいこと(アルゴリズムAの成功率が高い)を示すため、その反対の「認証成功の割合は等しい」という帰無仮説を立てる。
- 「差がある」ためにはこの「差がない」との仮説を否定(棄却)する。
判定の方法と基準
- χ²検定では、帰無仮説(成功率が等しい)が正しい場合に、得られたデータ(成功率の差)が出現する確率(p値)を計算する。
- 科学技術の世界では、有意水準(通常5%(p=0.050))を設定する。
- p値が有意水準を下回った時、「帰無仮説は棄却された」≈「有意な差がある」とみなす。
検定の実施例と結果の記述
- 試行回数が100回ずつの場合、成功率に9.0%の差があってもp=0.063となり、有意水準5%を下回らないため、有意差は認められない。
- 結果の記述例:「アルゴリズムAの成功率が高かったもののχ²検定を実施したところ、p=0.063であり、有意差はみられなかった。」
- 試行回数を200回に増やし同じ成功率の差(9.0%)であれば、p=0.0084となり、有意水準5%を下回るため、有意差があると結論づけられる。
- このように、χ²検定では試行回数(サンプルサイズ)が結果に大きな影響を与える。
2.4.16 3グループ以上の比較
2グループの比較には t検定や χ²検定を用いますが、3グループ以上になると多重比較の問題が生じます。この場合には ANOVA(分散分析) などの多変量解析手法を用います。
2.4.17 その他の注意点
- 論文に標準偏差を示すときには「平均値 ± 標準偏差(SD)」と明記する
- SD の桁数は平均値の1桁下まで揃える(例:12.3 ± 4.5)
- p値は有効数字2桁で記す(例:p=0.0049)
- 有意水準は一貫して記す(p<0.050 または p<0.010 を選ぶ)
- 「0.49%の有意差を認めた」とは誤りで、正しくは「p=0.0049で有意差を認めた」と書く
今回のまとめ
-
フォーマットの統一が重要
和文は全角、欧文・数式・単位は半角で統一し、学会や卒論集の指定に従う。 -
数値と単位の書き方
SI単位系を基本とし、数値と単位の間には半角スペースを入れる(例:3 km
)。 -
平均値だけでは不十分
データのばらつき(分散・標準偏差)を考慮しないと正しい比較はできない。 -
標準偏差(SD)と標準誤差(SE)の違い
- SD:データそのもののばらつき
-
SE:母平均の推定精度
→ 工学系論文では「平均値 ± SD」を示すのが基本。 -
統計検定の活用
- 2群比較:t検定
- 成功/失敗の比較:χ²検定
- 3群以上:ANOVA
→ p値が有意水準(通常 5%)を下回れば「有意差あり」と判断。