文系SE入社、基本情報技術者を勉強する✍ #1文字コード

はじめに

 はじめまして。2022年4月からSEとして入社することが決まっている、うさみみまるです。大学では心理学を学んでいました。そんな私が今年中に合格してね♪と言われているのが基本情報技術者試験。正直難しくてやっと文字が文字として理解できるようになってきたレベル。こんなことも知らずに入ったら何もできないよって気持ちを原動力に過去問を解く日々です……。そんな仕組みだったの!? いやいや難しいよ、なかなか覚えられないなって部分をブログにしていけば覚えられるかも作戦を始動します🐰!

 

 同じような境遇の方がいたら共感して頂けると嬉しいですし、有識者の方にはこんなことも分からないんだなと優越感に浸りつつ、あわよくばご教示頂きたいです。文系の部下がいる場合の指導にも役立つかもしれませんよ!(*´`*)なんてね!

 

#1 文字コード

 そもそもコンピュータって0と1だけを扱っているそうじゃないですか。すごいですね。意識なんて全くしていませんでした。よく分からないけど何でもできそうくらいにしか思っていませんでしたよ。ですから文字コードのおかげでコンピュータが文字を表現できるってことに驚いたわけです。

 

 ここで私が覚えなくてはならないのは以下4つの文字コードです。

  1. ASCII
  2. シフトJISコード
  3. EUC
  4. Unicode

 はい、これ。1から4を見た時の第一印象は、JISマークってあったよな~、日本っぽいのかな? です。他は名前の印象なんてものもありませんでした。はい、覚えることが沢山ありますね。

 

  1. ASCII(アスキー):1文字7ビット=1から4の中では情報量が最小

 英数字といくつかの記号を扱う、最も基本とされる文字コード。漢字と仮名がないそうで、これしか文字コードがなかったら英語をマスターしなきゃPCなんて使えなかったよ、な文字コード。最も基本ということなので、一番最初に覚える文字コードの名前はASCIIが良さそうです。一番最初だからAから始まるのかな、なんて思ったのですが、ASCIIを定めたのが米国規格協会=ANSIらしいのです。なので、I+キーでASCIIなんだなって覚えることにしました。

 

   2. シフトJISコード:1文字2バイト→ASCII以外は2バイトって1回はでてくる

 ASCIIに日本語を加えた文字コード。ひらがな・カタカナ・漢字を表現できるようで、このシフトJISコードのおかげで日本語をラクラクPC上で文字にできるんですね。今使っているWindowsでも使われているそうなので、まさに私はシフトJISコードの恩恵をうけまくっているというわけです。

 

  3. EUC:1文字2バイト・補助漢字3バイト

 なんとなく特徴を覚えづらいのがこれ。EUC。説明を見ると結構特徴的ではあるんですけど、EUCって単語の印象を強いて言うならEUって入ってるからヨーロッパぽいな~てなせいで特徴と結び付けづらいんですよ。日本語が使えるんですってΣ(・□・;)!そりゃ言語は沢山表現できるようにしといた方が使用できる人口が増えますもんね。うーん、すごい。でも覚えづらい!ほう、UNIXやLinaxといったOS上でよく使われるらしいです。このOSを覚えるのも大変で……。それはまたの機会に。そうだ、使える漢字を増やした補助漢字では3バイト使うんですって!

 

 おやおや? 上記を書きながらEUCってExtended Unix Code の略なんだって調べがつきましたよ。なーんだ、拡張UNIXコードとも言われるって説明書きのまんまじゃないですか! いやあ、わかりやすいなあ。

 

  4. Unicode:1文字2バイト→3バイト→4バイト...拡張されまくっている

 ラスト! これはですね、文字から受ける印象はなかったのですが、分かりやすくて覚えやすい特徴がありました。なんでも、世界中の文字コードを一つにまとめちゃった文字コードなんですね。世界的なとかって意味がuniversalにあることを考えれば、まあ覚えやすいですよね。文字の全てを一つのコード体系で表すには文字数が足りないという壁があるようで、文字を表す情報量はどんどん拡張されていっているそうです。

 

 

 過去問でよく悩むところには付箋を貼っているのですが、文字コードは今日でとれそうです。ふふ、まあ付箋が貼っていないページの方が少ないんですけどね🐰

 

 

 ここまで御覧頂きありがとうございました🌷