tFileInputDelimited Component로 파일을 읽고, tExtractRegexFields에서 정규식으로 뽑아내서 원하는 스키마에 저장하는 것으로 보입니다.
email -> name, domain, tld로 뽑아냄.
그런데 "([a-z]-)@([a-z]-).([a-z]-)" 이 정규식 부분에서
무조건 순서대로 name, domain, tld 로 extract 되는 것인가요?
아니면 직접 부분을 선택해서 원하는 field로 추출해 내는 것이 가능한지요?
답변 부탁드립니다. 감사합니다.
번호 | 제목 | 글쓴이 | 조회 수 | 날짜 |
---|---|---|---|---|
11 | InnoQuartz 측 추가된 component 설명서 확인 방법은? [1] | familyman | 52 | 2023.02.23 |
10 | Query For Guess Schema Patch | guest | 43 | 2023.02.15 |
9 | smartBig 서버 설정 | Jenna | 16 | 2022.03.04 |
8 | mysql8 지원문의 [1] | shkang9 | 12 | 2019.02.26 |
7 | 컴퍼너트 못찾는 현상 [3] | 양간지작살 | 12 | 2021.11.30 |
6 | etl 고려사항 | Jenna | 10 | 2022.04.20 |
5 | 구글 빅쿼리(BigQuery) 연동 문의 | 미스터손 | 9 | 2018.09.27 |
4 | smartBIG 서버 이관중 hive 컴포넌트 에러 발생 | Jenna | 8 | 2022.05.25 |
3 | max 키값 생성 및 연결 수정 작업 관련 문의입니다. [3] | 김종욱 | 7 | 2023.11.06 |
2 | 아래글 댓글에 추가 문의 올렸습니다. [2] | 김종욱 | 3 | 2023.11.08 |
1 | 울산 스마트시티 POC Sample Job | guest | 1 | 2022.11.29 |
직접 부분을 선택 한다는 것은 자리수 또는 Delimiter 를 지정하여 원하는 데이터를 뽑아내는것을 말합니다.
email 의 경우 Delimiter를 @ 로 해서 아이들 추출하고
문자열의 처음 부터 '@' 까지는 ID
'@' 에서 '.' 까지는 domain
'@' 다음 '.' 에서부터 '.' 까지 tld 로 추출 하면 됩니다.