カテゴリー別

お絵描き、デザイン

写真、動画関連ソフト

アメーバピグ専用ソフト

ホームページ関連

画像処理

スキャナー用

SEO 関連

お楽しみ

その他

過去ログ

2017年07月24日(月)

ウェブページの文字コードをシフトJIS から utf-8 に変換

今日は、ウェブページの文字コードを
シフトJIS (shift_jis) から、UTF-8
に変換する作業をしました。

ローカルでの作業はだいたい終わりましたが、
ウェブページは、まだシフトJIS です。
(まだ、アップロードしてないので)

文字コードの変換

まずは、ファイルの文字コードを変換します。

NonSoft さんの、 文字コード判定&変換ツール.NET
を使ってみました。バージョン 1.0.1.0 ということは
あまり、アップデートしていないと思われますが、
今のところ、特に不具合は見つかっていないので、
かなり優秀な気がします。すばらしい。

とはいえ、自動判定は完全じゃないだろうから、
入力文字コードは「SJIS」にして使いました。

対象拡張子は「html,css,php,js」で実行です。
あらかじめ、バックアップはとってあるので、上書きしちゃいます。

もちろん、出力文字コードは、UTF8
BOM は無い方がいいみたいなので「無し」で実行。

特に問題なく終了しましたが、英語のページは
もともと utf-8 だったので文字化けしました。
(正確には英語出力用のテンプレートHTMLで日本語あり)

ま、当然です。英語用の HTML はバックアップを
利用して、元に戻しました。

文字コードの指定を変更する

HTML には、
content="text/html;charset=shift_jis"
みたいな感じで文字コードを指定するところがあるので
content="text/html;charset=utf-8"
に変換です。

INASOFT さんの、複数行置換 を使ってみました。
これも、今のところ問題なく使えているので、優秀です。

置換内容は、コンテンツによるので何ともいえませんが、
自分の場合は、shift_jis とか Shift_JIS みたいな文字列を
utf-8 に一括変換でだいたいうまくいきました。

とはいえ、あてずっぽうに変換するわけにもいかないので、
まずは、どう変換されるかを予想してから一括変換しました。

複数行置換には、置換結果を予想する機能は無いので、
HNXgrep というツールで shift_jis を検索、結果を予想しました。
これも、なかなか優秀なうえに、多機能です。

HTML 自動生成するノの設定ファイルを書き替え

HTML 自動生成するノ のテンプレート HTML を
シフト JIS から、utf-8 に変換したので、
生成するノの設定ファイルを書き替えます。

まぁ、普通に画面で、文字コードを
「日本語 (シフトJIS)」から「utf-8」
に変更すればいいのですが、たくさんあって面倒
だったので、設定ファイルを一括変換しました。

自動生成するノの設定ファイル (拡張子 htg)
は、utf-8 BOM 無しの普通のテキストファイルなので、
複数行置換 で置換できちゃいます。

具体的には、
<TemplateCodePage>932</TemplateCodePage>

<IndexTemplateCodePage>932</IndexTemplateCodePage>
を、それぞれ
<TemplateCodePage>65001</TemplateCodePage>

<IndexTemplateCodePage>65001</IndexTemplateCodePage>
に変換すれば OK です。

<DataCodePage> はデータ用の文字コードで、
私は xls ファイルを使っているので、 932 のままで OK です。

最後に、HTML 自動生成するノ
で HTML を生成しなおして終わりです。

・・・

ふぅ。一件落着。

ご意見・ご要望連絡窓口


| 1/1026PAGES | >>