1998 년 Google은 처음에는 Backrub이라는 검색 엔진을 출시하여 40GB의 데이터로 Stanford 캠퍼스 서버에서 작동하고 DuPlo 블록으로 제작 된 경우에 보관했습니다. 2025 년 현재 Google의 검색 기능에는 여러 데이터 센터가 필요합니다. Ryan Pearce는 Searcha Page라는 DIY 검색 엔진을 만들었습니다. Searcha Page는 Seek Ninja라는 프라이버시 중심 버전을 포함하여 서버가 세탁실과 세탁실과 함께 세탁실에 위치하고 있습니다. 피어스는 “지금 세탁실에서 2000 년에 구글보다 더 많은 저장 공간을 가지고있다. 그리고 그것은 생각하기에 미쳤다.” 서버는 처음에 피어스의 침실에 있었지만 과도한 열로 인해 유틸리티 룸으로 옮겨졌습니다. “열은 절대적으로 끔찍한 일이 아니지만 문이 너무 오래 닫히면 문제가된다”고 그는 말했다. Searcha Page의 결과는 20 억 개의 항목이 포함 된 데이터베이스와 함께 6 개월 이내에 40 억에이를 것으로 예상됩니다. 이에 비해 Google은 1998 년에 2,400 만 페이지, 2020 년에는 4 천억 페이지를 보냈으며, 미국 v. Google LLC 독점 금지법 시험에서 밝혀졌습니다. Pearce의 엔진은 키워드 확장 및 컨텍스트 이해를 위해 대형 언어 모델을 사용합니다. 피어스는“내가하는 일은 실제로 매우 전통적인 검색이다. “이것은 20 년 전에 Google이했던 일입니다. 유일한 조정은 AI를 사용하여 키워드 확장을 수행하고 컨텍스트 이해를 돕는다는 것입니다.” AI는 Reverse Image Search, Google Rankbrain 및 2019 년 Bing의 90% ML 중심 결과와 같은 도구를 포함하여 검색 엔진의 핵심 부분이었습니다. Pearce는 구식이지만 강력한 서버 하드웨어를 구매하는 “업그레이드 차익 거래”를 활용합니다. 2020 년에 3,000 달러가 넘는 32 코어 AMD EPYC 7532 CPU는 이제 eBay에서 200 달러 미만입니다. “나는 같은 가격으로 다른 칩을 얻을 수 있었는데, 이는 스레드보다 두 배나 많은 스레드가 있었지만 너무 많은 열이 발생했을 것”이라고 그는 말했다. 전체 시스템 비용은 $ 5,000이며 스토리지에 3,000 달러를 소비했습니다. 피어스의 코드베이스는 약 150,000 줄의 코드이며, 약 50 만 줄의 반복 작업이 있습니다. Searcha Page 및 닌자를 찾으십시오. Sambanova를 사용하여 LLAMA 3 모델에 대한 빠른 액세스를 저렴한 비용으로 액세스하십시오. Sambanova의 CMO 인 Annie Shea Weckesser는 Pearce와 같은 솔로 개발자에게 저비용 모델에 대한 액세스가 점점 더 필수적이되고 있으며, 회사는“가정 설립에서 일하거나 생산을 운영하는지 여부에 관계없이 강력한 AI 모델을 빠르고 저렴하게 운영 할 수있는 도구를 개발하고 있다고 덧붙였습니다. 피어스는 일반적인 크롤링 저장소를 사용하여 크롤러를 구축합니다. “정말 감사합니다. 나는 그들에게 무언가를 돌려 줄 수 있기를 바랍니다. 벡터 데이터베이스를 사용하려는 초기 시도는 실패하여 “매우 예술적”결과를 초래했습니다. 피어스는 이제 LLM 생성 페이지 요약을 사용합니다. 또 다른 DIY 검색 엔진 개발자 인 Wilson Lin은 Corenn이라는 자체 제작 벡터 검색 도구를 사용하여 9 개의 개별 클라우드 서비스에 의존하여 비용을 낮게 유지합니다. “그것은보다 훨씬 저렴합니다 [Amazon Web Services]린은“상당한 금액”이라고 말했다. Pearce는 원래 Marginalia와 유사한 소규모 검색 엔진을 구상했으며, 중국의 누군가가 실제로 저에게 연락했습니다. . . 그는 에이전트의 검색과 같이 LLM을 공급하기를 원한 무수정 검색 엔진을 원한다고 생각합니다. “그는 영어를 넘어서 확장하는 새로운 데이터 세트가 필요할 것입니다. Pearce는 트래픽이 특정 임계 값에 도달하면 검색 엔진을 Coleoction 시설로 옮길 계획입니다. 일단 트래픽이 특정 임계 값에 도달하고 계열사 광고를 통해 겸손한 수익을 창출하고 있습니다. 세탁실 영원히.” Fast Company의 가장 혁신적인 회사 상에 대한 신청 마감일은 10 월 3 일 금요일 오후 11시 59 분 Pt입니다.

  Minecraft Legends 출시 날짜, 예고편 등

Source: Searcha Page DIY 검색 엔진 라이벌 Google의 초기 스토리지