PHP讀取漢字的點陣資料_php執行個體

來源:互聯網
上載者:User
項目中遇到的問題:

PHP如何讀取漢字的點陣資料?想實現輸入一段文字,能得到這一段文字的所有點陣碼。

解決方案:

簡體中文國標字型檔7445個字元,其中漢字6773個,包括一級漢字3755個,二級漢字3008個。採用2位元組(16位二進位)編碼。

區位碼:國標GB2312規定,所有的國標漢字與符號組成一個94×94的矩陣。在此方陣中,每一行稱為一個”區”,每一列稱為一個”位”,因此,這個方陣實際上組成了一個有94個區(區號分別為0 1到94)、每個區內有94個位(位號分別為01到94)的漢字字元集。一個漢字所在的區號和位號簡單地組合在一起就構成了該漢字的”區位碼”。在漢字的區位碼中,高兩位為區號,低兩位為位號。由此可見,區位碼與漢字或符號之間是一一對應的。

內碼:漢字的內碼是指在電腦中表示漢字的編碼。機內碼與區位碼稍有區別。目前,對於國內大多數的電腦系統,一個漢字的內碼佔兩個位元組,分別稱為高位位元組與低位位元組,且這兩位位元組與區位碼的關係如下: 內碼高位=區碼+A0H(H表示十六進位) 內碼低位=位碼+A0H 例如,漢字”啊”的區位碼為”1601″,區碼和位碼分別用十六進位表示即為”1001H”,則它的內碼為”B0A1H”。其中B0H為內碼的高位位元組,A1H為內碼的低位位元組。

返回由0和1組成的字串

<?php/*** 讀取漢字點陣資料**/$str = "中華人民共和國";$font_file_name = "simsun12.fon"; // 點陣字型檔檔案名稱$font_width = 12; // 單字寬度$font_height = 12; // 單字高度$start_offset = 0; // 位移$fp = fopen($font_file_name, "rb");$offset_size = $font_width * $font_height / 8;$string_size = $font_width * $font_height;$dot_string = "";for ($i = 0; $i < strlen($str); $i ++){if (ord($str{$i}) > 160){// 先求區位碼,然後再計算其在區位碼二維表中的位置,進而得出此字元在檔案中的位移$offset = ((ord($str{$i}) - 0xa1) * 94 + ord($str{$i + 1}) - 0xa1) * $offset_size;$i ++;}else{$offset = (ord($str{$i}) + 156 - 1) * $offset_size;}// 讀取其點陣資料fseek($fp, $start_offset + $offset, SEEK_SET);$bindot = fread($fp, $offset_size);for ($j = 0; $j < $offset_size; $j ++){// 將二進位點陣資料轉化為字串$dot_string .= sprintf("%08b", ord($bindot{$j}));}}fclose($fp);echo $dot_string;?>

以上所述就是本文的全部內容了,希望大家能夠喜歡。

  • 聯繫我們

    該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

    如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

    A Free Trial That Lets You Build Big!

    Start building with 50+ products and up to 12 months usage for Elastic Compute Service

    • Sales Support

      1 on 1 presale consultation

    • After-Sales Support

      24/7 Technical Support 6 Free Tickets per Quarter Faster Response

    • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.