본문 바로가기

Oracle242

[23ai] ai벡터검색 - vector_distance 앞의 예제를 테스트하다보니 벡터검색에서 SQL 작성시 vector_distance를 사용하는 것을 확인하였고, 이 함수에 대한 내용을 읽고 정리하였습니다. 사용 구문VECTOER_DISTANCE(VEC A,VEC B,metric); 두 벡터를 매개변수로 사용하여 거리를 계산합니다. metric부분에 사용가능한 메트릭을 지정하여 구할 수 있습니다. default는 코사인(Cosine)입니다. 입력벡터가 binary인 경우에 default는 헤밍(Hamming)입니다. VEC A 와 VEC B는 형식과 차원 수가 같아야 합니다.JACCARD_DISTANCE 또는 JACCARD 메트릭을 사용하는 경우 VEC A, VEC B는 이진 벡터로 평가해야 합니다.VEC A or VEC B가 null인 경우 null을 .. 2024. 11. 13.
[23ai] new feature 벡터 타입과 ai벡터검색 - pdf파일을 백터검색하기 (2) 테스트 목표 : 임베딩모델을 이용하여 pdf 파일을 분석하기 필요파일1)임베딩 모델 zip파일all_MiniLM_L12_v2_augmented.ziphttps://adwc4pm.objectstorage.us-ashburn-1.oci.customer-oci.com/p/VBRD9P8ZFWkKvnfhrWxkpPe8K03-JIoM5h_8EJyJcpE80c108fuUjg7R5L5O7mMZ/n/adwc4pm/b/OML-Resources/o/all_MiniLM_L12_v2_augmented.zip 2)ai-vector-search-users-guide.pdf     두개 파일을 테스트할 서버에 업로드합니다.1번파일 압축풀기$ mkdir -p /home/oracle/vector$cd /home/oracle/vector.. 2024. 11. 12.
[23ai] new feature 벡터 타입과 ai벡터검색 - 유사성검색 (3) 이전글과 이어집니다.https://bae9086.tistory.com/571 이전 글에서는 pdf 파일을 chunk로 테이블에 insert하는 것까지 완료하였습니다.이 데이터를 통해 유사성 검색을 테스트 해보도록 하겠습니다. 검색할 텍스트 : different methods of backup and recovery임베딩 모델 : ALL_MINILM_L12_V2 SQLPLUS에서 수행하는 방법과 디비버(client tool)에서 수행하는 방법으로 테스트해보았습니다.두개다 방식은 동일하며,1) 임베딩모델을 이용하여 쿼리 벡터를 먼저 생성한 후2)쿼리 벡터를 이용하여 유사한 Chunk를  테이블에서 검색합니다. 0)임베딩 모델 확인 ORA-40284: 모델이 존재하지 않습니다 발생시에는 DROP 후 재생성합니.. 2024. 11. 12.
[23ai] new feature 벡터 타입과 ai벡터검색 (1) 23ai가 되면서 생긴 새로운 데이터타입입니다.사용법은 아래와 같습니다.CREATE TABLE docs (doc_id INT, doc_text CLOB, doc_vector VECTOR); 그렇다면 벡터 검색이란 무엇이고 어떤 경우에 사용할까요?Oracle AI 벡터 검색Oracle AI Vector Search stores vector embeddings, which are mathematical vector representations of data points.수학적 벡터인 벡터임베딩을 저장하는데요. 벡터란 수학적인 벡터를 의미하고 임베딩은 자연언어 처리분야에서 자연언어를 벡터로 바꾸는 방식을 뜻하며 표현(representation)이라고도 합니다.벡터는 크기와 방향을 가진 데이터로 유사한 의미를 .. 2024. 11. 11.