Hadoop 프로세스 레코드는 블록 경계에서 어떻게 분할됩니까? 에 따르면 Hadoop - The Definitive Guide FileInputFormats가 정의한 논리 레코드는 일반적으로 HDFS 블록에 깔끔하게 맞지 않습니다. 예를 들어, TextInputFormat의 논리 레코드는 행이며 HDFS 경계를 넘어 자주 교차합니다. 이것은 프로그램의 기능에 영향을 미치지 않습니다. 예를 들어 라인이 빠지거나 끊어지지는 않습니다. 그러나 데이터 로컬 맵 (즉, 해당 호스트와 동일한 호스트에서 실행되는 맵)을 의미하므로 알만한 가치가 있습니다. 입력 데이터)는 일부 원격 읽기를 수행합니다. 이로 인한 약간의 오버 헤드는 일반적으로 중요하지 않습니다. 레코드 라인이 두 블록 (b1 및 b2)으로 분할되었다..