java判斷是否為漢字 和 是否有漢字

來源:互聯網
上載者:User
java判斷是否為漢字 和 是否有漢字2010-06-30 11:51

本文章為轉載他人文章

Java代碼

  1. publicboolean vd(String str){   
  2.      
  3.     char[] chars=str.toCharArray();   
  4.     boolean isGB2312=false;   
  5.     for(int i=0;i<chars.length;i++){   
  6.                 byte[] bytes=(""+chars[i]).getBytes();   
  7.                 if(bytes.length==2){   
  8.                             int[] ints=newint[2];   
  9.                              ints[0]=bytes[0]& 0xff;   
  10.                              ints[1]=bytes[1]& 0xff;   
  11.                             if(ints[0]>=0x81 && ints[0]<=0xFE && ints[1]>=0x40 && ints[1]<=0xFE){   
  12.                                          isGB2312=true;   
  13.                                         break;   
  14.                              }   
  15.                  }   
  16.      }   
  17.     return isGB2312;   
  18. }  

首先要import java.util.regex.Pattern 和 java.util.regex.Matcher
這兩個包,接下來是代碼

判斷是否為數字

Java代碼

  1. publicboolean isNumeric(String str)   
  2. {   
  3.         Pattern pattern = Pattern.compile(”[0-9]*”);   
  4.         Matcher isNum = pattern.matcher(str);   
  5.        if( !isNum.matches() ) {   
  6.           returnfalse;   
  7.         }   
  8.        returntrue;   
  9. }   
  10.   
  11. java.lang.Character.isDigit(ch[0])
Java代碼
  1. publicstaticvoid main(String[] args) {       
  2.         int count = 0;       
  3.           String regEx = "[\\u4e00-\\u9fa5]";       
  4.         //System.out.println(regEx);       
  5.           String str = "中文fdas ";       
  6.         //System.out.println(str);       
  7.           Pattern p = Pattern.compile(regEx);       
  8.           Matcher m = p.matcher(str);       
  9.         while (m.find()) {       
  10.             for (int i = 0; i <= m.groupCount(); i++) {       
  11.                   count = count + 1;       
  12.               }       
  13.           }       
  14.           System.out.println("共有 " + count + "個 ");       
  15.       }     

-------------------------------------------------------------------

判斷java String中是否有漢字的方法

java用的是Unicode 編碼char 型變數的範圍是0-65535 無符號的值,可以表示
65536個字元,基本上地球上的字元可被全部包括了,實際中,我們希望判斷一個字元是不是漢字,或者一個字串裡的字元是否有漢字來滿足業務上的需
求,String類中有個這樣的方法可得到其字元長度length() ,看下面例子,

Java代碼
  1. String s1 = "我是中國人";   
  2. String s2 = "imchinese";   
  3. String s3 = "im中國人";   
  4. System.out.println(s1+":"+new String(s1).length());   
  5. System.out.println(s2+":"+new String(s2).length());   
  6. System.out.println(s3+":"+new String(s3).length());  

OUTPUT:
我是中國人:5
imchinese:9
im中國人:5
看到了吧,字串裡如果有雙位元組的字元java就把每個字元都按雙位元組編碼,如果都是單位元組的字元就按單位元組編碼
於是按照以上的規律,結合一位QQ暱稱 ?G茶?I珠海 兄的提示由以下解決方案,就是判斷字串的長度和字元位元組的長度是否相同來判斷是否有雙位元組的字元

Java代碼
  1. System.out.println((s1.getBytes().length == s1.length())?"s1無漢字":"s1有漢字");   
  2. System.out.println((s2.getBytes().length == s2.length())?"s2無漢字":"s2有漢字");   
  3. System.out.println((s3.getBytes().length == s3.length())?"s3無漢字":"s3有漢字"); 
相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.