지금까지, 우리는 단순히 정적 문자열에 대 한 검색 했습니다. 정규 표현식은 아래 'Regexobject' 방법을 사용 하 여 문자열을 수정 하는 다른 방법으로 자주 사용 된다.
메서드/속성 () 분할 다시 일치 목록이 생성 장소에서 문자열을 분할 하위 찾습니다 ()는 다시 일치 및 sub ()로 다른 문자열 subn ()와 함께 그것을 대체 하지만 새 문자열 및 대체
의 수를 반환 합니다 모든 부분 문자열
문자열 조각
'Regexobject' Split () 메서드는 다시 일치 하는 장소에서 문자열 조각 목록을 반환 합니다. 문자열의 split () 메서드를 유사 하지만 더 많은 구분 기호를 제공 하 고 분할 () 공백 및 고정된 문자열을 지원. 당신이 예상 하듯이, 또한 모듈 수준 re.split () 함수가입니다.
분할 (문자열 [, Maxsplit = 0])
정규 표현식을 통해 문자열 조각 캡처 괄호는 다시에 사용 하는 경우 그들의 내용은 결과 목록으로 반환 됩니다. 경우는 maxsplit, 0이 아닌 다음 유일한 maxsplit 조각 분리 될 수 있다.
Maxsplit 값을 설정 하 여 조각 수를 제한할 수 있습니다. Maxsplit 0이 아닌 때 maxsplit 파편만 허용 되 고 문자열의 나머지는 리스트의 마지막 부분으로 반환 됩니다. 다음 예제에서는 구분 숫자가 아닌 알파벳 문자의 임의의 시퀀스 수 있습니다.
#! 파이썬
>>> p = re.compile (R '\w+')
>>> p.split ('는 테스트, 짧은 하 고 달콤한, 분할 ()의.')
['이', '있다', 'a', '테스트', '짧은' '과', '달콤한', '의', '분할', ' ']
>>> p.split ('는 테스트, 짧은 하 고 달콤한, 분할 ()의.', 3)
['이',' ', 'a', '테스트', 짧은 하 고 달콤한의 분할 ().]
가끔은 없습니다만 텍스트 구분 기호 사이에서 관심이 하지만 또한 구분이 뭔지 알고 해야 합니다. 캡처 괄호는 RE에 사용 되는 경우 해당 값도 목록으로 반환 됩니다. 비교는 다음과 같은 호출:
#! 파이썬
>>> p = re.compile (R '\w+')
>>> P2 = re.compile (R '(\w+)')
>>> p.split ('... 이것은 테스트입니다. ')
['이', '이다', '',' 테스트', ']
>>> p2.split ('... 이것은 테스트입니다. ')
['이 ','...] ', '', ', '한 ',', '' 테스트','.','
모듈-수준의 함수 Re.split, 다른 첫 번째 매개 변수로 다시
#! 파이썬
>>> re.split (' [\w]+ ',' 단어, 단어, 단어. ')
['단어', '단어', '단어', ']
>>> re.split ([\w]+) ', '단어, 단어, 단어.')
['단어', ', ', '단어', '', '단어','.', ']
>>> re.split (' [\w]+ ', ' 단어, 단어, 단어. ', 1)
[' 단어 ',' 단어, 단어. ']