7.文字列を扱ってユーザーにメッセージを伝える

新人エンジニア研修で知っておきたい文字列の使い方

なぜ、文字列の理解が重要なのか、その理由

この記事では、弊社の新人エンジニア研修の参考にJavaを解説します。

前回は配列の作成と使用について解説しました。

今回は文字と文字列の扱いについて解説します。文字列はコンピュータプログラム（すなわちそれを作った新人エンジニアであるあなた）とユーザーとのコミュニケーション手段ですからとても重要です。

1.Stringクラス

String（標準API）は java.langパッケージに含まれるクラスです。そのためimport文なしでいきなりソースコード中にStringと記述できるのでした。

以下のExample01はnew演算子とString()というコンストラクタを使って文字列のインスタンス化をする例です。

※new演算子とコンストラクタについては9.インスタンスの活用のところで詳しく学びます。

package chap07;

public class Example01 {
    public static void main(String[] args) {

        String str = new String("Hello");
        System.out.println(str);
    }
}

しかし、文字列はとても頻繁に使いますので、以下のように簡単にインスタンス化する方法も用意されています。むしろこちらが一般的な文字列のインスタンス化です。

package chap07;

public class Example02 {
    public static void main(String[] args) {

        String str2 = "Hello";
        System.out.println(str2);
    }
}

※しかもこの方法では、同じ文字列リテラルが使われるため、メモリ効率が良くなります。

つまり､Stringは、new演算子を使わなくてもインスタンスを作れる特殊なクラスです。ただし、実はこの二つのインスタンスの作り方では微妙な違いがあります。

2.equals()メソッド

以下のExample03は文字列を比較しようとしているプログラムですが上手くいっていません。

package chap07;

public class Example03 {
    public static void main(String[] args) {
        String str1 = new String("Hello");
        String str2 = new String("Hello");
        System.out.println(str1 == str2);

        String str3 = "Hello";
        String str4 = "Hello";
        System.out.println(str3 == str4);
    }
}

＜実行結果＞

false
true

ここで、str1～4は参照です。参照が指し示しているのは"Hello"が格納されている"メモリのありか"です。

str1とstr2は異なる２つのインスタンスが作られています。ですから、それぞれが格納されているメモリのありかも違っていて、その結果上記のfalseが表示されたのでした。（下図参照）

対して、str3とstr4では同じ１つのインスタンスを参照しています。

実は、str4を＝演算子でインスタンス化したとき、メモリの中を検索して、同じ文字列"Hello"があれば、それを再利用しているのです。（下図参照）その結果、trueが表示されたのでした。なにしろ、Javaの前身はOakという家電組み込み用のプログラミング言語だったのでメモリの節約を考慮したのです。（現在のJavaには文字列のインスタンスを再利用するStringプールという仕組みがあります。）

そうすると気をつけなければならないことがあります。例えば、ログインのシステムを考えてみましょう。ユーザーが画面から入力したIDとデータベースに格納されているIDを照合するといった処理を考えます。その際、2つのユーザーIDは別々のヒープ領域に格納されています。どのようにして同じであるという判断をしたら良いでしょうか？

＝＝で比較するのではなく、Stringクラスのequals()メソッドを使います。

以下のExample04を見てください。

package chap07;

public class Example04 {
    public static void main(String[] args) {
        String str1 = new String("Hello");
        String str2 = new String("Hello");
        System.out.println(str1 == str2);
        System.out.println(str1.equals(str2));
    }
}

＜実行結果＞

false
true

下図はイメージです。

新人エンジニア研修で2つの文字列が同じであるかどうかを調べるにはequalsメソッドを使うことを説明 — 2つの文字列が同じであるかどうかを調べるにはequals()メソッドを使う

この後、研修が進むと、Webシステムでログインのシステムを作ります。その時のために２つの文字列が同一の文字列であるか確かめるためにはequals()メソッドを使わなければならないということを理解してください。

NullPointerExceptionは新人エンジニア研修で最も多い例外

上記のコードに以下の２行をつけ足してみましょう。

		str1 = null;
		System.out.println(str1.equals("Hello"));

NullPointerExceptionはJavaで最も頻繁に発生する例外の一つで、特に参照型の変数がnullのままメソッドを呼び出すときに発生します。

例えば、str1 = null;とした後にstr1.equals("Hello")を実行すると、str1がnullであるためequalsメソッドを呼び出せず、プログラムは例外を投げて停止します。

nullは参照だけあって、その先の実体がない状態です。例えれば、リモコンだけあってテレビやエアコンがない状態です。

このような例は実務でもよく見られ、ユーザー入力や外部データの取得結果が想定外にnullであるケースが原因となります。Nullチェックを怠ると、原因特定が難しいバグに繋がるため、事前のチェックや安全な初期化が非常に重要です。

3.イミュータブル

もう少し、Stringクラスの話を続けたいと思います。実は、Stringクラスのインスタンスは一度作ったら中身を変えられないのです。

以下のExample05を見てください。

package chap07;

public class Example05 {
    public static void main(String[] args) {
        String str1 = "Hello";
        str1 = str1 + " World";
        System.out.println(str1);
    }
}

＜実行結果＞

Hello World

このとき、表示結果には影響ありませんが、7行目でstr1という参照が新しい String オブジェクトを指すように変更され、元の "Hello" はガーベージコレクションの対象になります。Stringクラスのインスタンスは一度作ったら中身を変えられないのです。このような性質を不変性：イミュータブル(immutable)といいます。

映画などで突然変異で生まれた生物をミュータントといいますね。また、ウイルスが流行した時に話題になるのが【mutant】ですね。immutable とは mutate（変化する）という動詞に im-（否定）をつけた形容詞です。

それを証明する次のExample06を見てください。

package chap07;

public class Example06 {
    public static void main(String[] args) {
        String str1 = "Hello"; //①
        String str2 = str1; //②
        System.out.println(str1 == str2);

        str1 = "World"; //③

        System.out.println(str1 == str2);
    }
}

＜実行結果＞

true
false

もし③でstr1に”World”を代入した時点で参照はそのままで参照が指し示す値だけを上書きしたとしたら、2回ともtrueとなるはずです。ですが”World”を代入した時点で（名前は同じ）新たな参照が作成されたため、str1とstr2の参照値は異なりfalseとなった訳です。（下図参照）

上記のヒープ領域の"Hello"を"aloha"とか"Hey"に変更はできないのです。これがString型がイミュ―タブル(不変)【immutable】であるということです。Javaの設計者がStringをイミュ―タブルにした理由はいつくかありますが、一つはマルチスレッド対応です。

プログラムを複数の処理の流れに分けることをマルチスレッドといいます。英語の【thread】には「糸」という意味があります。ある処理（thread）が文字列を処理している途中で別の処理（thread）がその文字列を書き換えてしまうとまずいのですね。そのため文字列はイミュータブルなのです。（さらに近年は様々なクラスをイミュータブルで作成することが多くなってきています）

さて、理由はさておき実務において､このことはどのような問題があるでしょうか？

例えば、大量の文字列の結合を繰り返す場合に、その都度新しいインスタンスを生成するためパフォーマンスが悪化します。何千何万回と文字列を結合するような場合には、Stringクラスを「＋」で結合するのではなく、StringBuilderクラスのappend()メソッドを使うことをお勧めいたします｡時間が許せば問題集で確認しましょう。

例題

以下の処理が行われると何が表示されますか？また、それはなぜですか？

int a = 1;
int b = a;
a = 2;
System.out.println(a + ":" + b);

int[] a1 = { 1 };
int[] a2 = a1;
a1[0] = 2;
System.out.println(a1[0] + ":" + a2[0]);

String s1 = "Hello";
String s2 = s1;
s1 = "Goodbye";
System.out.println(s1 + ":" + s2);

4.Stringクラスの便利なメソッド

Stringクラスには、（charのようなプリミティブ型とは違い）文字列を扱うための便利なメソッドが用意されています。

そのほんの一部を紹介します。

以下のExample07は「新人エンジニアのためのJava研修」という文字列を使って文字列の文字数を数えたり、任意の文字列の出現位置を調べたり、任意の文字列が含まれるか調べたり、任意の文字列を置き換えたりといったことをしています。

package chap07;

public class Example07 {
    public static void main(String[] args) {
        String str = "新人エンジニアのためのJava研修";

        System.out.println(str.length() + "\n");

        System.out.println(str.indexOf("Java"));
        System.out.println(str.indexOf("Python") + "\n");

        System.out.println(str.contains("研修"));
        System.out.println(str.contains("Python") + "\n");

        String str2 = str.replace("エンジニア", "SE");
        System.out.println(str2);

    }
}

＜実行結果＞

17

11
-1

true
false

新人SEのためのJava研修

【length】は、「長さ」という意味なのでlength()メソッドは文字数を返します。

indexOf()メソッドは、文字列を配列としてみたときの添え字【index】の値のうち、実引数の文字列が最初に現れた添え字を返します。見つからない場合は-1を返しますので、正の数を返した場合はその文字列が存在するということで文字列の存在判定ができます。

配列の復習ですが、添字の数え方は下図の通り0始まりです。

【contains】は、「含む」という意味、【replace】は、「置き換え」という意味ですので文字通りですね。

他にも色々便利なメソッドがありますからStringの標準APIを探検してみてください。

また、後半のシステム開発演習では大きな数値を扱うとき、３桁カンマで表示するようにお願いすることが多いのですが、それは、以下のExample08のように書いて実現できます。

package chap07;

public class Example08 {
    public static void main(String[] args) {
        int price = 123456789;
        System.out.println(String.format("%,d", price));
    }
}

＜実行結果＞

123,456,789

業務システムでは金額を扱うことが多いですからStringクラスのformat()メソッドは重要です。3桁カンマ以外の書式についてはクラスFormatter（標準API）を調べてください。例えば､円周率の少数点第3位四捨五入2位表示（四捨五入）であれば､

System.out.printf("%.2f", Math.PI);

のように書くことができます。

5.インスタンスを作らなくても仕事をしてくれるstaticメソッド

ここで、注目していただきたいのは、メソッドの呼び出し方です。

String.format("%,d", price)

Stringは先頭文字が大文字になっています。これは、クラスですね。クラスに属するメソッドということでクラスメソッドまたはstaticメソッドと呼ばれます。本書では以降staticメソッドで統一します。

【static】は静的という意味で、反意語は【dynamic】（動的）です。staticはクラスにあらかじめ用意してあるメソッドという意味です。動的に作り出したインスタンスが持つメソッドではないという意味です。

staticメソッドは、クラス名.メソッド名()という形で呼び出すことができます。

一方、

str.length()

のようにインスタンスを作ってから、その個々のインスタンスのメソッドを呼び出すのをインスタンスメソッドといいます。インスタンスメソッドは、変数名．メソッド名()という形で呼び出します。インスタンスは先頭が小文字、クラスは先頭が大文字というルールですから見分け方は簡単ですね。使い分けはベテランでも迷うところですから今は気にしなくて大丈夫です。

ここでは、なぜ、staticメソッドとインスタンスメソッドがあるのかを考察してみましょう。

str.length()は、str（その中身は"新人エンジニアのためのJava研修"）という文字列自身の長さということですから、インスタンスメソッドがふさわしいのです。インスタンスが変われば文字列の長さも変わりますね。

オブジェクト指向には責務という考え方があります。文字列の文字数は誰（どのインスタンス）が知っているべきかというのが責務の例です。この場合は、個々の文字列が自分の文字数を知っているべきです。オブジェクト指向を一言で片付けると「自分のことは自分でしよう」という考え方といえるからです。

一方、String.format()はintを整形して（この例では）String(123,456,789)を得るメソッドです。この処理にはStringのインスタンスが作られる必然性がありません。インスタンスを生成することは、CPU時間とメモリ容量のムダです。最終的な結果として表示される“123,456,789”というStringのインスタンスが得られれば良いのです。

そのため、String.format()はインスタンスではなくクラスに属すると考えて、staticメソッドであるべきなのです。intに対応するStringを生成するのは、個々のインスタンスには関係のない決まりきった内容の処理だからです。（下図参照）

ただし、staticメソッドは次回のテーマになっていますのでそこでも詳しく学ぶとしましょう。

調べてみましょう

研修の最後にWebアプリケーションを作成することがよくあります。

その際に以下の処理はどのように実現しますか？

1．電話番号（090-1234-5678）からスペースを無くしたデータ（09012345678）に加工したい。

2．パスワード入力する際に前後に半角スペースや全角スペースを入れてしまってもOKと判定したい。（"password"も" password "も"　password　"も同じ文字列に加工したい）

6.nullはどのオブジェクトも指していない特別な状態を示す

ヒープ領域に確保された文字列のための領域を開放するにはどうしたらいいでしょうか?

参照型にnullを代入することで、その参照はインスタンスを参照しなくなります。nullとは「何もない」という意味の特別な意味を持った予約語で「参照がどのオブジェクトも指していない」ことを示します。ちなみに、Javaの場合0 や "" は有効な値であり、null とは異なります。（英語のイディオムでも【null and void：無効の】という表現がありました。voidもすぐあとの章で出てくるのであわせて覚えてください）

Javaにはガーベージコレクションという機構があり､どこからも参照されなくなったインスタンス（今回は文字列）は消去されメモリ領域が開放されます。

以下のExample14は参照をnullにして最終的にどこからも"ABC"という文字列のインスタンスを参照しないようにしています。

package chap07;

public class Example09 {
    public static void main(String[] args) {
        String str1 = new String("ABC");
        String str2 = str1;
        str1 = null;
        System.out.println(str2);
        str2 = null;
        System.out.println(str2);
    }
}

＜実行結果＞

ABC
null

"ABC"という文字列は1つですが､この文字列を指し示す参照は当初"str1"と"str2"の2つがあります。しかし、nullを代入することによってこれら2つの参照はどこも指さなくなりました。そして､どこからも参照されなくなった時に､この文字列はガーベージコレクションの対象になります。

JVMがガーベージコレクションを走らせるのですが､いつ､ガーベージコレクトをするのかをプログラマーの側で指示することはできません。あくまでプログラマーができるのはガーベージコレクトを依頼することだけです。

最後にnullまたは空文字をチェックする方法を確認しておきます。この知識は、例えば、JavaWebアプリケーションを作成する際に役に立つでしょう。なぜなら、データベースから取得した値がnullであるということは良くあることだからです。

以下のExample15は、ユーザーからの文字列を入力として受け取ります。その文字列がnullかどうかをチェックし、次にその文字列が空文字列（つまり、長さが0の文字列）かどうかをチェックします。もし文字列がnullまたは空であれば、その旨を出力します。それ以外の場合は、ユーザーが入力した文字列をそのまま出力します。

なお、ScannerのnextLine()メソッドはユーザーが何も入力せずにEnterを押してもnullを返すことはありません。しかし、Webアプリケーションを学ぶとnullチェックが必須になりますのでここで注意喚起しています。

package chap07;

import java.util.Scanner;

public class Example10 {
	public static void main(String[] args) {
		try (Scanner scanner = new Scanner(System.in)) {
			System.out.print("文字列を入力してください: ");
			String userInput = scanner.nextLine();

			// nullチェック
			if (userInput == null) {
				System.out.println("入力がnullです。");
				// 空文字チェック
			} else if (userInput.isEmpty()) {
				System.out.println("入力が空です。");
			} else {
				System.out.println("入力された文字列: " + userInput);
			}
		}
	}
}

nullは参照だけあって、その先の実体（インスタンス）がない状態でしたね！

例題

以下のKazuateTestクラスにはバグがあります。どのようなバグでしょうか？また、バグを修正してください。

package chap07;

import java.util.Scanner;

import chap01.Kazuate;

public class KazuateTest {
	public static void main(String[] args) {

		System.out.println("0-9の整数で数を当ててください!");
		Scanner sc = new Scanner(System.in);
		int guess = sc.nextInt();
		sc.close();

		Kazuate game = new Kazuate();
		game.getMessage().length();
		game.checkAnswer(guess);

		System.out.println(game.getMessage());
		System.out.println("答えは " + game.getAnswer());
	}
}

Success

何度でも受けられるテストへのリンク

例題

以下は、Kazuate クラスを題材とした問題です。

【問題1】equals()メソッドの必要性について
Javaでは、文字列の内容を比較する際に等価演算子（==）ではなく equals メソッドを使うべきとされています。
このルールに従わなかった場合に起こり得る誤動作の例を、Kazuate クラスの「getMessage() の戻り値」と "あたり" という文字列を比較する場面を想定して説明してください。

【問題2】Stringクラスの便利なメソッドの活用例
Kazuate クラスの message フィールドに格納された文字列が、たとえば「もっと大きいよ！」や「もっと小さいよ！」のように感嘆符付きで返されるようになったとします。
このとき、結果を出力する前にそのメッセージをすべて小文字に変換して表示したい場合、どのような String クラスのメソッドを使えば良いか答えてください。また、逆に大文字にしたい場合はどうしますか？

【問題3】NullPointerException が発生する可能性について
Kazuate クラスの message フィールドは、コンストラクタの時点では明示的に初期化されていません。そのため、最初に checkAnswer メソッドを呼び出さずに getMessage メソッドを呼んだ場合、戻り値が null になる可能性があります。
このような状況で message に対して文字列操作を行った場合、NullPointerException が発生することがあります。この例とその回避策について説明してください。

以上、今回は「文字列を扱ってユーザーにメッセージを伝える」方法について見てきました。

次回は、「メソッド定義して処理を再利用する」です。

新人エンジニア研修向けのJava SE 8の解説

文字列を扱ってユーザーにメッセージを伝える　最後までお読みいただきありがとうございます。

研修のカリキュラムを見てみる

新人エンジニア研修で知っておきたい文字列の使い方

なぜ、文字列の理解が重要なのか、その理由

1.Stringクラス

2.equals()メソッド

NullPointerExceptionは新人エンジニア研修で最も多い例外

3.イミュータブル

例題

4.Stringクラスの便利なメソッド

5.インスタンスを作らなくても仕事をしてくれるstaticメソッド

調べてみましょう

6.nullはどのオブジェクトも指していない特別な状態を示す

例題

例題

文字列を扱ってユーザーにメッセージを伝える 最後までお読みいただきありがとうございます。

文字列を扱ってユーザーにメッセージを伝える　最後までお読みいただきありがとうございます。