Table Sorting

HTML の table の行を、列の内容でソートする関数を作ろう。

試作1

最初に作ったのは、こんな関数だった。原理的には、 HTMLCollection に直接 sort 関数をあてることができないので、各行 (tr 要素) を配列 x に格納して x をソートし、それを順に戻すと言うもの。

var compareIndex = 0;
function sortRows ( section ) {
  var x=new Array;
  for(var i=0; i<section.rows.length; i++) x[i] = section.rows[i];
  x.sort( compareFunc );
  for( i=0; i<section.rows.length; i++)
    section.insertBefore(x[i], section.rows[i]);
}
function compareFunc (a, b) { 
  var a_ = a.cells[compareIndex].firstChild.nodeValue;
  var b_ = b.cells[compareIndex].firstChild.nodeValue;
  return a_ < b_ ? -1 : a_ != b_;
}

// 呼び出し例; 文書内の最初の tbody を列 2 でソート
compareIndex=2; sortRows( document.getElementsByTagName('tbody')[0] );

これはちょっと宜しくない。なんせ比較関数に列番号を渡せないもんで compareIndex をグローバル変数にして使っている。そして比較関数の中の処理が若干重いようで、これがちょっと行数の多い表になると半端じゃない時間がかかる。特に Mozilla で、行が 100 を超えるあたりから処理時間が目立ち始め、特にソート済みのデータに対する処理が重い。 IE はソート処理はそこそこ高速な模様。だけどレンダリング効率が悪いようで、行数が増えると理不尽に処理時間がかかるようになる。 テストケース1

sortRows の一行あたりのソート/レンダリング時間(単位:ミリ秒/行)
Moz sort Moz render Moz total IE sort IE render IE total
10行 1.00 1.00 2.10 0.30 0.50 0.90
50行 2.01 1.06 3.28 0.50 0.30 0.90
100行 2.88 1.15 4.19 1.28 1.37 2.68
150行 2.83 1.25 4.28 1.45 2.10 3.62
200行 2.98 1.29 4.48 1.59 2.85 4.52
400行 2.97 1.79 5.04 2.02 5.95 8.09

試作2

以上を踏まえて、作り直す。修正内容としては、比較関数内で引数から実際に比較する値を取得するまでの経路を短くするために、配列 x の各要素の値を行要素からセル要素に変更した。 insertBefore で配列から表に書き戻す時も、セルの parentNode で列を取得できるので問題ない。結果として比較対象の列インデックスを引数で受け取れる用になった。また今回はソート中にソート対象やその長さが変わるようなことはないので、あらかじめ変数に取得しておくことにした。

function sortRows2 ( section, index ) {
  var x=new Array, rows=section.rows, N=rows.length;
  for(var i=0; i<N; i++) x[i] = rows[i].cells[index];
  x.sort( compareFunc2 );
  for( i=0; i<N; i++) section.insertBefore(x[i].parentNode, rows[i]);
}
function compareFunc2 (a, b) { 
  var a_ = a.firstChild.nodeValue;
  var b_ = b.firstChild.nodeValue;
  return a_ < b_ ? -1 : a_ != b_;
}

// 呼び出し例; 文書内の最初の tbody を列 2 でソート
sortRows2( document.getElementsByTagName('tbody')[0], 2 );

試作1と比較して、 IE で 90-85%, Mozilla で 70-60% まで処理時間を短縮できた。些細なことだけれども、こういうことでこれだけの効果が望める。 テストケース2

sortRows2 の一行あたりのソート/レンダリング時間(単位:ミリ秒/行)
Moz sort Moz render Moz total IE sort IE render IE total
10行 0.60 0.70 1.40 0.10 0.40 0.60
50行 0.88 0.90 1.87 0.54 0.62 1.20
100行 1.66 1.02 2.80 0.73 1.34 2.09
150行 1.58 1.07 2.80 0.81 2.08 2.93
200行 1.78 1.17 3.12 0.91 2.84 3.79
400行 2.33 1.52 4.09 1.15 5.92 7.11

試作3

試作3では配列にセル (td, th 要素) を格納した。なぜ直接比較する値である firstChild.nodeValue でないのかというと、理由は 2 つある。まずソート後の配列をテーブルに反映させる時に、文字列からはこれが含まれていた tr 要素を参照できないこと、そしてそのような関数では firstChild がテキストでなく要素であるようなケースに対応できず、汎用性にかけるということ、この 2 点だ。

この 2 点を解決しようと試作3では試みた。セルから比較対照の値を抜き出す部分だけを外部関数化してカスタマイズしやすくし、その戻り値をオブジェクト型に型変換してプロパティに tr 要素を持たせるようにした。これによって比較関数を用意しなくてもいいようになった。

function sortRows3 ( section, index ) {
  var x=new Array, rows=section.rows, N=rows.length;
  for(var i=0; i<N; i++)
    x[i] = Object( getDataFunc3( rows[i].cells[index] ) ), x[i].row=rows[i];
  x.sort();
  for( i=0; i<N; i++) section.insertBefore(x[i].row, rows[i]);
}
function getDataFunc3 ( cell ) {
  return cell.firstChild.nodeValue;
}

// 呼び出し例; 文書内の最初の tbody を列 2 でソート
sortRows3( document.getElementsByTagName('tbody')[0], 2 );

Mozilla の処理時間はさらに半分、試作1と比較して 30% 程度になった。ソート済みの配列を同じソートをかけた時の問題もなくなった。 IE の処理時間は試作1の 60-70% 程度。 テストケース3

sortRows3 の一行あたりのソート/レンダリング時間(単位:ミリ秒)
Moz sort Moz render Moz total IE sort IE render IE total
10行 0.00 0.90 1.10 0.00 0.20 0.40
50行 0.02 0.90 1.22 0.00 0.64 0.72
100行 0.03 0.95 1.29 0.00 1.30 1.42
150行 0.05 1.10 1.27 0.02 2.05 2.20
200行 0.03 1.10 1.39 0.01 2.79 2.94
400行 0.05 1.46 2.01 0.00 5.90 6.05

試作4

試作3までの改良で、大分処理速度は向上した。あとは使い勝手の部分だ。現在のところ次のような問題が残っている:

というわけで、これを解決してみたい。データ取得関数、比較関数ともに、引数で指定するかこの関数のプロパティに設定するかのどちらかだと思う。

function sortRows4 ( section, index, cmpfn, getfn ) {
  var x=new Array, rows=section.rows, N=rows.length;
  cmpfn = cmpfn || arguments.callee.compareFunc;
  getfn = getfn || arguments.callee.getFunc
                || function(cell){return cell.nodeName;};
  for(var i=0; i<N; i++)
    x[i] = Object( getfn( rows[i].cells[index] ) ), x[i].row=rows[i];
  if ( cmpfn ) x.sort( cmpfn ); else x.sort();
  for( i=0; i<N; i++) section.insertBefore(x[i].row, rows[i]);
}
// データ取得関数
function getDataFunc4 ( cell ) {
  return cell.firstChild.nodeValue;
}
// 降順ソート用比較関数
function compareFunc4 ( a, b ) {
  return a > b ? -1 : a != b;
}

// 呼び出し例: 文書内の最初の tbody を列 2 でソート
sortRows4( document.getElementsByTagName('tbody')[0], 2, undefined, getDataFunc4 );

// 比較関数を指定した呼び出し例: 降順ソート
sortRows4( document.getElementsByTagName('tbody')[0], 2, compareFunc4, getDataFunc4 );

// データ取得関数のデフォルトを getDataFunc4 に設定する例;
sortRows4.getFunc = getDataFunc4;
// 上は次のようにも記述できる:
sortRows4.getFunc = function ( cell ) { return cell.firstChild.nodeValue; }

// 比較関数を compareFunc4 に設定する例;
sortRows4.compareFunc = compareFunc4;
// 上は次のようにも記述できる:
sortRows4.compareFunc4 = function ( a, b ) { return a_ > b_ ? -1 : a_ != b_; }

// 以上の指定があれば、次の記述で sortRows4.getFunc, sortRows4.compareFunc が
// デフォルトで使用される
sortRows4( document.getElementsByTagName('tbody')[0], 2 );

テストケース4, テストケース4(降順ソート)

sortRows4 の一行あたりのソート/レンダリング時間(単位:ミリ秒/行)
Moz sort Moz render Moz total IE sort IE render IE total
10行 0.00 1.00 1.10 0.00 0.30 0.40
50行 0.00 0.88 1.16 0.00 0.60 0.68
100行 0.01 0.98 1.24 0.00 1.30 1.45
150行 0.03 1.03 1.30 0.01 2.04 2.19
200行 0.04 1.08 1.38 0.00 2.76 2.90
400行 0.04 1.42 1.86 0.00 5.80 5.96

試作5

ここまでの結果から、次のようなことを推測してみた。

試作1-4までで行った改良は、主に Mozilla 向けの改良、つまり実際のソート処理の改良だった。できれば IE 向けの改良、レンダリング面の改良も行いたいと思う。問題は for 文で並べ替えているため、どうしても行数分だけ再描画が発生することである。

ここで一つ思いついた。一度ソート対象の tbody 要素を文書ツリーから削除して、バックグラウンドで再構築した後に書き戻したらどうだろう? これなら画面の書替えは 2 回しか発生しない。 テストケース5

function sortRows5 ( section, index, cmpfn, getfn ) {
  var x=new Array, rows=section.rows, N=rows.length;
  var marker = document.createElement('tbody');
  cmpfn = cmpfn || arguments.callee.compareFunc;
  getfn = getfn || arguments.callee.getFunc
                || function(cell){return cell.nodeName;};
  for(var i=0; i<N; i++)
    x[i] = Object( getfn( rows[i].cells[index] ) ), x[i].row=rows[i];
  if ( cmpfn ) x.sort( cmpfn ); else x.sort();
  section.parentNode.replaceChild( marker, section );
  for (var i=0; i<N; i++ ) section.appendChild(x[i].row);
  marker.parentNode.replaceChild( section, marker );
}

問題が出るのは行数が多い場合なので、ここでは 200 行と 400 行の場合だけ実験結果を示す。

sortRows5 の一行あたりのソート/レンダリング時間(単位:ミリ秒/行)
Moz sort Moz render Moz total IE sort IE render IE total
200行 0.02 0.34 0.63 0.02 1.35 1.49
400行 0.04 0.35 0.80 0.01 2.18 2.33

以上の結果、試作1から処理時間を元の 20-30% 程度にまで抑えることができた。

テストケースについて

各テストケースは、上記の関数に処理時間を計測する目的でいくつか式を追加している。具体的には、次の式を追加している。

function sortRows ( section ) {
  var t0=new Date; // 関数開始時刻
  ... // 
  var t1=new Date; // ソート開始時刻
  ... // ソート関数呼び出し
  var t2=new Date; // ソート終了/レンダリング開始時刻
  ... // レンダリング処理
  return([t1-t0, t2-t1, new Date-t2]); // 処理終了時刻
}

各実験結果は、ランダムに作成した表に対してソート処理を10回ずつ行い、平均処理時間(ミリ秒)を行数で割った値を比較した。

もちろん、この実験で計測できるのは JavaScript コードの処理時間でしかないので、特にレンダリングについては実際の描画がこのとおりであるとは必ずしも言えない。

この実験は以下の環境で行った。

Issued: / Revised: / All rights reserved. © 2002-2017 TAKI