HIT해

파싱이란? 본문

CS

파싱이란?

힛해 2024. 8. 30. 00:01
728x90

파싱(Parsing)이란?

파싱(parsing)은 구문 분석이라고 한다. 이는 문장이 이루고 있는 구성 성분을 분해하고, 이 분해된 성분들의 위계 관계를 분석하여 구조를 결정하는 과정이다. 간단히 말해, 데이터를 분해하고 분석하여 원하는 형태로 재조립하거나 필요한 정보를 추출하는 작업을 의미한다.

예를 들어, 웹 페이지의 HTML 문서를 파싱하여 원하는 텍스트나 태그를 추출하는 것이 일반적인 파싱 작업의 하나다.


파싱과 함께 알아두면 좋은 개념: 렉싱(Lexing)

파싱과 밀접한 개념으로 **렉싱(Lexing)**을 알아두면 좋다. 렉싱은 파싱의 앞 단계로, 입력된 텍스트 데이터를 토큰(token)이라는 더 작은 단위로 분해하는 작업을 의미한다. 이 토큰들은 이후 파싱 과정에서 분석의 기본 단위로 사용된다. 예를 들어, "x = 5 + 3"이라는 문자열이 있을 때, 렉싱은 이를 '변수', '등호', '숫자', '더하기 기호' 등의 토큰으로 나누는 과정이다.


파싱의 예시

  • HTML 파싱: 웹 페이지의 HTML 코드를 분석하여 필요한 데이터나 구조를 추출하는 작업이다.
  • JSON 파싱: JSON 형식의 데이터를 파싱하여 필요한 정보로 변환하거나, 특정 데이터 구조로 재조립하는 작업이다.
  • 컴파일러의 파싱: 프로그래밍 언어의 소스 코드를 파싱하여, 컴파일러가 이해할 수 있는 중간 표현이나 기계어로 변환하는 작업이다.

'CS' 카테고리의 다른 글

DNS  (0) 2024.08.30
브라우저 렌더링 과정  (0) 2024.08.30
도메인이란?  (0) 2024.08.30
마이그레이션이란?  (0) 2024.08.30
의존성 주입이란?  (0) 2024.08.29