文字セット:青銅器時代以来の悪い考え

紀元前 522 年、ダリウスとしても知られる𐎭𐎠𐎼𐎹𐎢𐏁 はペルシャ帝国の王でした。王は権力を行使するにつれて名声を切望し、ダリウス (後にギリシャ人は Δαρεῖος と呼ばれた) は部下に彼の名前を石に彫らせました. 、これは本当に石というより山です。そして、山の顔に自分の伝記が刻まれることは間違いなく成功のしるしですが、人々が書かれていることを理解できなければ、あまり意味がありません.

バビロニア、ペルシャ、エラムの 3 つの帝国が交差する場所のどこかにベヒストゥン碑文の座席を集めることができます。彼の偉大さがすべての人に知られるようにするために、王は彼の伝記を 3 つの言語に翻訳しました。確かに、ハリー・ポッターほど印象的ではないかもしれませんが、J.K.ローリングは山の顔に本を彫りませんでした。

その山がアラム語に翻訳されたパピルスも発見されました。これは、Netflix が存在しないため、多くの人々がダリウス大王について知りたがっていたことを示しています。

すべての偉大な王としてダリウスが死に、すべての帝国と同様に、ペルシャ帝国は崩壊しました。

その後しばらくして、人々は砂を虫に変えることができることを発見し、コンピューター サイエンスが誕生しました。当時、砂は高価だったため、IBM は 50 年代後半に 6 ビットを使用して文字をエンコードする方法を発見しました。

しかし、それは、数十年前に使用されていたインターナショナル テレグラフ アルファベットよりも少し多かった. Émile という名前の人物を知っている場合、非常に便利でした。たとえば、Émile Zola、または Baudot コードの発明者である Émile Baudot です。

すべての優れた国際標準と同様に、インターナショナル テレグラフ アルファベットはわずかに互換性のない 12 のバージョンに分類されました。私たちは歴史を否定的に見る傾向があります。アメリカの内戦が激しさを増していた当時、ヨーロッパは革命の波にさらされていましたが、世界の他の地域は植民地主義の荒廃に苦しんでいました。郵便局は、この用語が作られる 1 世紀以上も前に文字化けに耐えるだけでした。

しかし、私が言ったように、1950 年代後半に、IBM は 2 進化 10 進数 (BCD) と呼ばれる 6 ビット エンコーディングを使用することを選択しました。当時の IBM の社長は、トーマス J. ワトソンと呼ばれていました。おそらくそれが、ベーコン暗号とは異なり、IBM 704 BCD エンコーディングに J があった理由です。 Émile はアーティスト名であり、International Business Machines の CEO にふさわしい名前ではありません。704 BCD エンコーディングは 64 文字を表すことができるため、IBM は慎重に 51 文字を選択しました。 ⌑ と ‡ を含め、IBM ではレコードマークとして知られています。Unicode 標準では、適切な代替品は U+2021 DOUBLE DAGGER です。この狂気のすべてに対処するとき、パンチカードはあなたを十分になだめることができないかもしれないからです.BCDエンコーディングには明らかに非常に多くのバリエーションがあったため、ウィキペディアはそれらをすべてリストすることを気にしません.

IBM が 6 ビットでは十分ではないことに気付き、EBCDIC を思いついた頃には、ビル・ゲイツが生まれ、日本人はコンピューターがちょっとクールだと気付きました。昼寝の代わりに。

しかし、ここに問題があります:

テキストは人のためのものです。人は旅をし、交流します。 Ó Briain のような馬鹿げた名前を持っています。 Ó Briain は台所にいて、ハラペーニョとチョーリソを調理しています。もちろん、人々は分別のある文字しか使っていなかったので、古き良きシェイクスピアの英国人がこのナンセンスに苦しむ必要はなかったと主張するかもしれません.

開発者は実際には人間ではありません。彼らは [a-Z] に満足しており、それで問題ありません。

普通の人はテキストを使います。そして、人々があなたのシステムで使いたがる文字を予測する方法はありません。一部の馬鹿は、古いペルシャ語をウェブサイトに掲載することを決定するかもしれません (ところで、Dārayauš はアラム語で 𐡃𐡓𐡉𐡅𐡄𐡅𐡔 と呼ばれていました)

人々が馬やボートを発明したとき、アルファベットのアイデアは希薄になり始めました.文字セットのアイデアは最初から偽物でした.文字が場所に限定されているという考えはただのクレイジーな話です.グーテンベルクが文字を落としても大丈夫だったのかもしれません.彼は彫るのが面倒だったが、あなたはその選択をすることができなかった.

それで、あなたのレガシーコードは?壊れてます。生きている最強の男はとても強いので、彼の名前でデータベースを壊すことができます.そうです。

Behistun Inscription が IBM と契約していた場合、ダリウス大王について知ることができたでしょうか?

Unicode 以外をサポートするためにどれだけのエネルギーを浪費する必要がありますか?