UFO ET IT

누구나 neo4j vs titan을 시도했습니다-장단점

ufoet 2020. 11. 28. 13:18
반응형

누구나 neo4j vs titan을 시도했습니다-장단점


누구든지 Neo4j와 Titan의 좋은 비교를 제공하거나 지적 할 수 있습니까? 제가 볼 수있는 한 가지는 규모 측면에서 볼 수 있습니다. Titan은 규모 확장이며 cassandra와 같은 기본 확장 가능한 데이터 저장소가 필요합니다. Neo4j는 HA 전용이며 자체 내장 데이터베이스가 있습니다. 다른 장단점이 있습니까? 특정 사용 사례. (현재 Titan은 어디에서나 사용되고 있습니까?)

또한 다음 링크가 있습니다. http://architects.dzone.com/articles/16-graph-databases-compared 그래프 데이터베이스에 대한 객관적인 비교를 제공하지만 Neo4j와 Titan 간의 장단점에 대해서는별로 없습니다.


우리는 하루에 거의 100 만 개의 노드와 두 배의 에지를 추가하는 소셜 그래프를 가지고 있습니다. 우리는 neo4j 그래프로 시작했습니다. 그 이유는 그래프 엔진이 실행되는 동일한 머신에 저장소가 있다는 사실로 인해 매우 빠르기 때문입니다. 그러나 다음은 neo4j에 대해 여러분과 공유하고 싶은 경험입니다.

  1. 실시간 쿼리에 적합하지 않습니다. 트위터와 같은 사회 구조가 있습니다. 사용자가 자신의 타임 라인에서 팔로우하는 모든 사용자의 최근 20 개 활동 (및 관련 활동)을 표시해야합니다. 1000 명 이상의 사용자를 팔로우하는 사용자가 있습니다. 이를 위해 작성한 gremlin 쿼리 (관심이 있다면 gremlin 쿼리를 공유 할 수 있음)는 실제로 너무 많은 GC를 생성하여 8 cpu 및 48 gb 램이있는 서버가 정지하는 데 사용되었으며 서버를 다시 시작하여 다시 온라인 상태로 만들어야했습니다. .
  2. 많은 시간 네트워크 파티션이 관찰되었습니다.
  3. graoh 데이터베이스에서 매우 필요한 정점 중심 인덱스가 없습니다.

궁극적으로 우리는 gremlin 쿼리를 사용하여 서버 성능이 너무 저하되어 데이터베이스를 titan으로 변경해야했습니다.

titan에서 우리는 합리적인 성능을 얻고 있으며 cassandra를 백엔드 스토리지로 사용하기 때문에 확장도 매우 쉽습니다. 그러나 여기에서 gremlin을 사용하는 것도 좋은 생각이 아닙니다.


그래프 데이터베이스를 살펴 보시 다니 반갑습니다. 질문의 Neo4j 부분에 대해 이야기하겠습니다.

이제 Global 2000의 30 개 이상이 Neo4j를 광범위한 사용 사례를 위해 프로덕션에 사용하고 있으며, 그중 상당수는 우리에게도 놀라운 일입니다! (그리고 우리는 속성 그래프를 발명했습니다!)

고객의 일부 목록은 아래에서 확인할 수 있습니다. www.neotechnology.com/customers

Neo4j는 10 년 동안 24 시간 연중 무휴로 생산되었으며, 그 이후로 제품은 물론 크게 발전했지만 매우 견고한 기반 위에 구축되었습니다.

그래프 데이터베이스로 이동하는 대부분의 회사 (내가 아는 Neo4j라고 말하면)는 a) RDBMS가 연결된 쿼리 요구 사항의 범위 및 규모를 처리 할 수 ​​없었기 때문에 그렇게하고 있습니다. ) 그래프 (소셜, 네트워크 및 데이터 센터 관리, 사기, 포트폴리오, ID 등) 인 도메인을 테이블이 아닌 그래프로 모델링 할 때 제공되는 엄청난 편의성과 속도.

올해 전 세계 주요 도시에서 개최 된 네 번 (곧 다섯 번) GraphConnect 컨퍼런스에서 다음과 같은 여러 고객 이야기를 확인할 수 있습니다.

http://watch.neo4j.org/

런던에 계시다면 다음 주에 마지막 행사가 열립니다 : http://www.graphconnect.com

몇 가지 고객 사례와 함께 Neo4j의 기술에 대한 요약을 아래에서 확인할 수 있습니다. 확장에 대한 질문에 매우 직접적으로 이야기하기 : Neo4j는 각 인스턴스가 네트워크를 통해 이동할 필요없이 그래프에 액세스 할 수있는 방식으로 수평 확장을 허용함으로써 쿼리 응답 시간 및 쿼리 예측 가능성을 최대화하도록 설계된 고유 한 아키텍처를 가지고 있습니다. (더 많은 읽기 처리량이 필요합니다. 인스턴스 만 추가하면됩니다.)이 접근 방식은 단일 Neo4j 클러스터에서 실행되는 Facebook 소셜 그래프의 절반 이상을 보유한 일부 프로덕션 고객을 포함하여 그래프의 95 % 이상에서 잘 작동하는 것으로 나타났습니다. "항상 켜져있는"24x7 웹 사이트를 지원합니다.

www.neotechnology.com/neo4j-scales-for-the-enterprise/

세계 최대의 우편 배송 서비스 중 하나가 Neo4j를 사용하여 모든 실시간 패키지 라우팅을 수행합니다. 철도는 Neo4j에 라우팅 시스템을 구축하고 있습니다. 세계 최대 고객 중 일부는 HR 및 데이터 거버넌스, 대체 경로 라우팅, 네트워크 및 데이터 센터 관리, 실시간 사기 탐지, 생물 정보학 등에이를 사용하고 있습니다.

Neo4j의 Cypher 쿼리 언어는 속성 그래프를 위해 명시 적으로 구축 된 유일한 선언적 쿼리 언어입니다. 13 년 된 네이티브 Java API (다른 그래프 데이터베이스 중 일부가 이후 채택한 Blueprints의 기반)에서 배운 모든 교훈을 차세대 언어로 롤링합니다. Cypher는 그래프를 배우고 응용 프로그램을 개발할 수있는 좋은 방법입니다. 특별한 요구가 있거나 편의성보다 "베어 메탈"성능 (즉, 밀리 초 미만 대 한 자릿수 밀리 초) 성능을 중시하는 경우 항상 기본 Java API가 있습니다. Neo4j는 그래프를 지원하기 위해 처음부터 구축되었으며 그래프를 저장하도록 구축 된 그래프 스토리지 엔진을 가지고 있습니다. 그래프가 아닌 데이터베이스 위에 그래프 라이브러리로 설계된 그래프 데이터베이스 에코 시스템에 대한 최근 추가 기능과는 달리, 일부 고유 한 제한 사항이 적용됩니다. (예를 들어 FlockDB는 MySQL을 기반으로하기 때문에 하나 이상의 홉에 대해서는 여전히 매우 느립니다.)

더 구체적인 사항이 필요한 경우 언제든지 Neo 팀에 문의하십시오. 기꺼이 도와 드리겠습니다! http://info.neotechnology.com/ContactUs.html

행운을 빕니다!

참고 URL : https://stackoverflow.com/questions/17269306/anybody-tried-neo4j-vs-titan-pros-and-cons

반응형