ポインタ (プログラミング)
ポインタ (pointer)とは、あるオブジェクトがなんらかの論理的位置情報でアクセスできるとき、それを参照するものである。有名な例としてはC/C++でのメモリアドレスを表すポインタが挙げられる。
なお、C++では、さらに独立した「参照」というものがある(#参照の節を参照)。
問題点
ポインタには不正な領域を示しうるという問題がある。例えば近年セキュリティ上で問題となっているバッファオーバーランの原因の多くは、ポインタ演算のエラーで起こる不正領域の書き換えによるものである。またオブジェクトそのものへの操作とオブジェクトの位置への操作が混在することはプログラマの混乱を招きやすい。このような問題もあって、新しいプログラミング言語では言語レベルでのポインタ機能は排除される方向にある。
むろんこのような言語でもポインタ概念が存在しないわけではない。例えば配列中にオブジェクトを格納してそれを要素のインデックスで参照するとすれば、やはりこれは「ポインタ概念」と呼べる物であり、配列の要素数を超えた領域をアクセスするときにエラーが起こるだろう。だが配列へのインデックスアクセスをも完全排除してしまえば、その言語は制限が強く、少なくとも単純な動作を簡易に記述できる領域を狭めてしまう。このようにポインタは危険性もあるが、プログラミング上強力なテクニックである。また、C言語にてマイコンの周辺デバイスを制御する場合、メモリバス上の特定のアドレスにあるレジスタに値を読み書きする必要があるため、必須のテクニックとなる。
一方で関数型言語などの発展によりポインタの必要性は今後減少する可能性が考えられる。またデータベース領域では、SQLのように関係式からデータを導き出し情報の位置を抽象化する概念が古くからあり、こちらもプログラミングパラダイムに影響を与えることが考えられる。
C言語のポインタ
テンプレート:Sister C言語の、特定のメモリ領域を表現するポインタは、最も典型的なポインタの例といえる。
Cにポインタが存在する理由は効率上の問題である。元々UNIXを記述するシステム用言語として開発されたCは、アセンブラに可能な操作のほぼ全てを行える必要があった。そのため特定のメモリ領域への値の直接代入能力を持つなど、プログラミング言語全体ではむしろ異例とも言える強力なポインタ機能を備えている。
Cの実行モデルでは、実行プログラム上の関数コード、データが全て一次元のアドレスに直列配置される。そのためデータはおろか、関数のアドレスを取得し、他の関数にエントリー情報として渡す事も可能である。
またCの関数では引数は値渡しのみで参照渡しをサポートしないが、これはアドレスの数値を取得すれば参照に可能な全てを行えるので、実質的に参照を数値と同一視できるからである。実際に初期のCではアドレス値は整数型互換するものとして扱われていた。これは値と参照を明確に区別するPascalなどとは対照的である。現在でもCはvoid*により任意のメモリ領域にアクセスできる(なおC++では参照渡しもサポートするようになった)。
しかしコード領域をも含むメモリを直接扱えるという事は、言語レベルでは(意図的でないとしても)不正なメモリアクセスを事実上保護できないということを示しており、Cのプログラムにおけるポインタ関連のバグの多さがそれを証明している。
実際の例
一般的なソースは、ポインタが指している領域の値を参照する間接演算子(indirection operator)"*"と、アドレス演算子"&"を用いて記述される。未初期化のポインタ変数は不定の領域を指しているが、不定の領域を指している場合、未初期化状態と有効な領域を指している状態の区別がつかないためNull(ヌル)値を代入しポインタが無効な領域を指している事を明示する。
単純なポインタ
- 宣言例(int型変数へのポインタである、ポインタ型変数"ptr" を定義)
int *ptr;
- int型変数"n"へのポインタを宣言
int n; ptr = &n;
- 何も指していないポインタ(Nullポインタ)
ptr = NULL; または ptr = (void *)0;
C++0xであれば
ptr = nullptr;
- 呼びだし例
*ptr = 10; または scanf("%d", ptr);
- 「ポインタへのポインタ」と定義することも可能(多重間接参照)
int **pptr;
- トリッキーな例
while(*argv != NULL) printf("%s\n", *argv++);
配列argvがポインタとしても扱えることを利用しているが、間接演算子"*"とインクリメント演算子のどちらの優先度が高いのかを知らないと理解できない記述なので、保守作業の際にバグを誘発しやすいため、以下のように記述したほうがよいとする主張もある。
while(*argv != NULL) { printf("%s\n", *argv); argv++; }
関数ポインタ
上述の通りCでは関数を指すポインタが作れる。
- 宣言例 (引数double・返値doubleの関数を受け取るポインタ "f" を定義)
double (*f)(double);
- 呼びだし例
f = sqrt; printf("f(16) = %g\n", f(16)); printf("f(25) = %g\n", (*f)(25)); /* 明示のためかこちらの方が使われやすい */
関数ポインタを引数にとって使うことで、処理を外部から組み込むことが可能である。主にイベント処理や、判断を外部に任せて処理を行うときなどに用いられる。無名関数の仕組みがないため後者の用途では少し記述が冗長になるが、C++ではBoostという外部ライブラリを使うことでこれを補完できる。
上の例では直接変数を定義したが、実際には可読性を上げるためtypedefして使うことが多い。
typedef double (*mathfunc)(double); mathfunc f; f = sqrt; /* ... */
(ポインタと実体が混乱する例)
ポインタ演算
記憶(メモリ)空間は一次元空間である。ポインタが示すアドレスはこの一次元記憶空間の座標(Point)であり、その他の一次元空間における座標と同じ演算が可能となっている。逆に言えば、整数の様な自由な四則演算は制限されており、座標に対する演算と同じ演算しか出来ないという事である。ポインタという名称もこの座標の概念に由来する。なお一次元空間であるため、座標に対する加減算はベクトルではなくスカラー値が用いられる。
char *point1, *point2, *point3;
/* 任意の座標(アドレス)を代入できる */
point1 = (char*)0x4;
/* 座標にスカラー値を加算できる様に、スカラー値を加算できる */
point2 = point1 + 1;
/* スカラー値で減算できる */
point1 -= 1;
/* 座標に乗算除算できないのと同じく、下記のような乗算除算はできない */
point1 *= 2;
point1 /= 2;
/*
座標同士の減算では、座標間の向きと距離をベクトルで
得られるのと同じく、向きと距離をスカラー値で得られる
*/
ptrdiff_t difference;
difference = point2 - point1;
/*
座標同士では引き算以外出来ないのと同じく、下記のような
加算・乗算・除算・余剰演算はできない
*/
point3 = point1 + point2;
point3 = point1 * point2;
point3 = point1 / point2;
point3 = point1 % point2;
参照
C++における参照は、ポインタと同様「変数がメモリ上に置かれている場所」と解される場合もあるが、それよりもむしろ「その変数を参照する(=変数の値を操作したり出来る)権限」と解されることが多い。参照の概念そのものはメモリの概念と切り離して考えることが可能である(実装上はポインタと同じであることも多い)。
C++における参照の例
int n = 5; int& n2 = n; // n2をnへの参照で初期化する
この場合変数n2はnを参照している。n2とnはオブジェクトを共有しているのでn2と呼んでもnと呼んでも同じものを表す。すなわち変数nにエイリアス(別名)n2が付いたことになる。