Inicio / hive 쿼리 예제

hive 쿼리 예제

이것은 null 값을 처리하는 또 다른 방법입니다. Hive 테이블의 열에 대해 null이 아닌 요구 사항을 적용할 수는 없지만 해당 열에 (필수) 주석을 추가할 수 있습니다. 첫 번째 예제에서는 row.salary 위로 마우스를 가져가면 해당 형식을 System.Nullable 표시됩니다. 그러나 급여 열에 주석이 추가되는 경우 해당 형식은 대신 int이 됩니다. Hive 쿼리 언어(HiveQL)는 보물 데이터의 기본 데이터 처리 방법입니다. HiveQL은 아파치 하이브에 의해 구동된다. 보물 데이터는 사용자가 클라우드에서 데이터를 수집, 저장 및 분석할 수 있는 CDP입니다. 보물 데이터는 사용자의 쿼리를 받아들이고 Hadoop MapReduce 프레임워크를 사용하여 실행하는 자체 Hadoop 클러스터를 관리합니다. HiveQL은 지원하는 언어 중 하나입니다. SELECT 문은 0.13.0 이전 또는 0.13.0 이후 릴리스에서 정규식 기반 열 사양을 사용할 수 있습니다.ist.support.quoted.identifiers 는 없음으로 설정되어 있습니다.

이 자습서에서는 Hadoop 시스템에서 간단한 Hive 쿼리를 실행하는 다양한 방법을 보여 줍니다. 여기에 포함 된 샘플은 Hortonworks 샌드 박스의 깨끗한 설치를 사용하고 상자에서 포함 된 샘플 테이블 중 일부를 쿼리합니다. 데이터베이스는 Hive 웨어하우스의 기본 위치에 만듭니다. Cloudera에서 Hive 데이터베이스는 /user/하이브/웨어하우스에 저장됩니다. 테이블을 분할하거나 버킷화할 필요는 없지만 이러한 추상화를 통해 시스템에서 쿼리 처리 중에 많은 양의 데이터를 정리할 수 있으므로 쿼리 실행속도가 빨라집니다. 다음 예제와 같이 데이터가 위의 형식이 아닌 경우 필드 구분 기호를 parametrized할 수 있습니다. userid 열을 사용합니다. 이 작업은 다음 쿼리와 같이 조인을 통해 수행할 수 있습니다. 이것은 실제로 우리가 Map reduce 프레임 워크의 관점에서 정렬, 그룹 화 및 클러스터로 쿼리를 수행 할 때 백 엔드 프로세스입니다. 따라서 결과를 여러 감속기에 저장하려면 클러스터 바이로 이동합니다. A와 B를 추가하는 결과를 제공합니다.

결과 의 형식은 모든 정수가 float이기 때문에 예를 들어 피연산자 형식의 공통 부모(형식 계층 구조)와 동일합니다. 따라서 float는 정수를 포함하는 유형이므로 플로트와 int의 + 연산자는 플로트가 생성됩니다. 사용자는 Hive 언어로 기본적으로 지원되는 기능을 사용하여 데이터 스트림에서 사용자 지정 매퍼 및 감속기를 연결할 수도 있습니다. 예를 들어 사용자 지정 매퍼 스크립트(map_script)와 사용자 지정 감속기 스크립트를 실행하기 위해 reduce_script – 사용자는 TRANSFORM 절을 사용하여 매퍼 및 감속기 스크립트를 포함하는 다음 명령을 실행할 수 있습니다. 다음은 하나의 삽입 문을 사용하여 모든 국가 파티션에 데이터를 로드하는 예입니다: 명령 sudo 하이브를 제공하여 하이브 쉘로 이동하고 `데이터베이스 만들기` 명령을 입력하여 Hive에 새 데이터베이스를 만듭니다.