트러스트 센터

Triggerfish는 모델이 무시할 수 있는 프롬프트가 아닌 -- LLM 계층 아래의 결정론적 코드에서 보안을 시행합니다. 모든 정책 결정은 프롬프트 인젝션, 사회 공학 또는 모델 오동작에 의해 영향을 받을 수 없는 코드로 이루어집니다. 심층 기술 설명은 보안 우선 설계 페이지를 참조하십시오.

보안 통제

이 통제는 현재 릴리스에서 활성화되어 있습니다. 각각은 코드로 시행되고 CI에서 테스트되며 오픈 소스 저장소에서 감사 가능합니다.

통제	상태	설명
Sub-LLM 정책 시행	ACTIVE	8개의 결정론적 hook이 LLM 처리 전후에 모든 동작을 가로챕니다. 모델은 보안 결정을 우회, 수정 또는 영향을 미칠 수 없습니다.
데이터 분류 시스템	ACTIVE	4단계 계층 구조(PUBLIC, INTERNAL, CONFIDENTIAL, RESTRICTED)와 필수 no-write-down 시행입니다.
세션 Taint 추적	ACTIVE	모든 세션이 접근한 데이터의 최고 분류를 추적합니다. Taint는 상승만 가능하고 감소하지 않습니다.
불변 감사 로깅	ACTIVE	모든 정책 결정이 전체 컨텍스트와 함께 로깅됩니다. 감사 로깅은 시스템의 어떤 구성 요소도 비활성화할 수 없습니다.
시크릿 격리	ACTIVE	자격 증명은 OS 키체인 또는 vault에 저장됩니다. 구성 파일, 저장소, 로그 또는 LLM 컨텍스트에는 절대 없습니다.
Plugin 샌드박싱	ACTIVE	타사 Plugin은 Deno + WASM 이중 샌드박스(Pyodide)에서 실행됩니다. 선언되지 않은 네트워크 접근, 데이터 유출 없습니다.
종속성 스캔	ACTIVE	GitHub Dependabot을 통한 자동 취약점 스캔입니다. 업스트림 CVE에 대해 자동으로 PR이 생성됩니다.
오픈 소스 코드베이스	ACTIVE	전체 보안 아키텍처가 Apache 2.0 라이선스이며 공개 감사 가능합니다.
온프레미스 배포	ACTIVE	인프라에서 전적으로 실행됩니다. 클라우드 종속성 없음, 텔레메트리 없음, 외부 데이터 처리 없음.
암호화	ACTIVE	전송 중 모든 데이터에 TLS. 저장 시 OS 수준 암호화. 엔터프라이즈 vault 연동 가능.
책임 있는 공개 프로그램	ACTIVE	정의된 대응 일정이 있는 문서화된 취약점 보고 프로세스입니다. 공개 정책을 참조하십시오.
강화된 컨테이너 이미지	PLANNED	Google Distroless 기반의 거의 제로 CVE Docker 이미지입니다. CI에서 자동 Trivy 스캔.

심층 방어 -- 13개 독립 계층

단일 계층만으로는 충분하지 않습니다. 한 계층이 손상되더라도 나머지 계층이 시스템을 계속 보호합니다.

계층	이름	시행
01	채널 인증	세션 수립 시 코드로 검증된 신원
02	권한 인식 데이터 접근	시스템 자격 증명이 아닌 소스 시스템 권한
03	세션 Taint 추적	자동, 필수, 상승만 가능
04	데이터 계보	모든 데이터 요소에 대한 완전한 출처 체인
05	정책 시행 Hook	결정론적, 우회 불가, 로깅됨
06	MCP Gateway	도구별 권한, 서버 분류
07	Plugin 샌드박스	Deno + WASM 이중 샌드박스 (Pyodide)
08	시크릿 격리	OS 키체인 또는 vault, LLM 계층 아래
09	파일시스템 도구 샌드박스	경로 제한, 경로 분류, taint 범위 I/O
10	에이전트 신원 및 위임	암호화 위임 체인
11	감사 로깅	비활성화 불가
12	SSRF 방지	IP 거부 목록 + DNS 확인 검사
13	메모리 분류 게이팅	자체 수준에서 쓰기, 아래로만 읽기

전체 심층 방어 아키텍처 문서를 읽어보십시오.

Sub-LLM 시행이 중요한 이유

대부분의 AI 에이전트 플랫폼은 시스템 프롬프트 -- "민감한 데이터를 공유하지 마십시오"라고 LLM에 지시하는 것 -- 를 통해 보안을 시행합니다. 프롬프트 인젝션 공격은 이러한 지시를 재정의할 수 있습니다.

Triggerfish는 다른 접근 방식을 취합니다: LLM은 보안 결정에 대해 권한이 없습니다. 모든 시행은 LLM 계층 아래의 결정론적 코드에서 발생합니다. LLM 출력에서 보안 구성으로의 경로가 없습니다. :::

컴플라이언스 로드맵

Triggerfish는 인증 전 단계입니다. 보안 현황은 아키텍처적이며 소스 코드에서 오늘 검증 가능합니다. 공식 인증은 로드맵에 있습니다.

인증	상태	비고
SOC 2 Type I	PLANNED	보안 + 기밀성 트러스트 서비스 기준
SOC 2 Type II	PLANNED	관찰 기간 동안 지속적인 통제 효과
HIPAA BAA	PLANNED	의료 고객을 위한 비즈니스 제휴 계약
ISO 27001	PLANNED	정보 보안 관리 시스템
타사 침투 테스트	PLANNED	독립적인 보안 평가
GDPR 준수	PLANNED	구성 가능한 보존 및 삭제를 갖춘 자체 호스팅 아키텍처

신뢰에 대한 참고

보안 핵심은 Apache 2.0으로 오픈 소스입니다. 정책 시행 코드의 모든 줄을 읽고, 테스트 스위트를 실행하고, 주장을 직접 검증할 수 있습니다. 인증은 로드맵에 있습니다. :::

소스 감사

전체 Triggerfish 코드베이스는 github.com/greghavens/triggerfish에서 사용 가능합니다 -- Apache 2.0 라이선스.

취약점 보고

보안 취약점을 발견한 경우 책임 있는 공개 정책을 통해 보고해 주십시오. 보안 취약점에 대해 공개 GitHub 이슈를 생성하지 마십시오.

트러스트 센터 ​

보안 통제 ​

심층 방어 -- 13개 독립 계층 ​

Sub-LLM 시행이 중요한 이유 ​

컴플라이언스 로드맵 ​

신뢰에 대한 참고 ​

소스 감사 ​

취약점 보고 ​