13 Apr '12, 2am

@mugijiru nkfの-Xではだめなんでしょうか(デフォルト)。

文章を読もうとしたら文字化けしてしまっていて困った、という経験は誰しもあるでしょう。しょうがないので調べると、文字コードを変換すれば読めるようになる、などとの説明を見つけることが出来るでしょう。多くの方の「文字コードとの出会い」は、おそらくこのあたりなのではないでしょうか。さて、そんな文字コードですが、そもそもいったい何者なのでしょうか。 文章をコンピュータで扱おう思うと、文字をコンピュータで扱わなければなりません。しかし、ご存知のとおり、基本的にコンピュータは 0 と 1 しか扱えないため、文字をコンピュータが扱える形に変換する (符号化する) 仕組みが必要となります。この仕組みが文字符号化であり、符号化の仕方の一つ一つが文字コードです。 コンピュータの扱う情報量の最小単位は 0 か 1 によって表される情報量であり、これを bit と呼びます。通常は 8bit (1octet) を一組にして 1byte とし、これを基本にしてコンピュータは情報をやりとりします。文字も同様に byte を一単位としてやりとりすることになります。つまり、文字コード*1 とは、文字を byte の列に変換する体系のことと言えるのです。 文字コードの種類 文字コードは一つではありません。例えば日本語を表すのに用いられる文字コードには、主に以下のようなものがあります。 ISO-2022-JP (JIS) Shift_JIS (亜種として CP932) EUC-JP UTF-8 UTF-16 異なる文字コードで表された文章は、一般に異なるバイト列に変換されます。そのため、例えば Shift_JIS で表された文書を、 EUC-JP として表示しようとすると、正しくその文書を見ることが出来ません。これが文字化けです。 文字化けの解決方法は二つあります。 一つはその文書を正しい文字コードで表示することです。多くのプログラムはいくつかの文字コードに対応しているので、正しい文字コードで表示しなおせば、文書を見ることが出来ます。この例の場合では、 Shift_JIS として...

Full article: http://jp.rubyist.net/magazine/?0009-BundledLibraries#l22

Tweets

rubyのチュートリアルがなくなってるびまの中に埋め込まれている.これだけ取り出してhttp:...

jp.rubyist.net 07 Apr '12, 4am

Rubyでプログラミングを体験しよう 「これからプログラミングをはじめたい!」 「今までプログラムには興味があったけど難しそうでなかなか手を出せなかった……」 そんな人に Ruby のプログラミングを紹介します。 筆者はゲームプログラマー*1 ...

るびまのインタビュー(例: )の文字起こしのバイトがあるとして,いくらくらいで手伝ってくれるで...

jp.rubyist.net 14 Apr '12, 8am

著名な Rubyist にインタビューを行う企画「Rubyist Hotlinks」。 第 29 回となる今回は、日本における Ruby on Rails の第一人者で、Ruby のコミッタでもある松田明さんにお話を伺いました。松田さんは、フリ...

Scoot Picks INK to Publish Its Quarterly In-Fli...

superadrianme.com 13 Apr '12, 2am

Scoot Picks INK to Publish Its Quarterly In-Flight Magazine Posted On Friday, April 13, 2012 By Adrian . Under Airline , t...