Auditor

BETA

Evaluate the security of your website Chatbots, models, and code under several compliance frameworks.

Page Loading...

ChatBot Assistant

Auditor

Select Attacks

Multi-select with search, choose some attack to preform on your model

Chatbot Mode

Models

Console Debug

Validity, Reliability, And Generalization Limits

Demonstrate system reliability in intended environments; document generalization boundaries.

Measure Outcome

Safety / Harms to Individual

GAI systems are regularly evaluated for safety. Systems must demonstrate the ability to fail safely and operate within residual risk tolerance.

Measure Outcome

Risk Measurement Selection and Documentation

Metrics and methods are selected to measure high-priority AI risks and trustworthiness. Unmeasurable risks are documented.

Measure Outcome

Independent and Community Review

Involve internal experts not part of the dev team, external assessors, and community input in regular evaluations.

Measure Outcome

Human Subject Protection in Evaluation

Human subject evaluations are representative and meet applicable ethical, legal, and privacy protections.

Measure Outcome

Performance and Assurance Testing

Evaluate AI system performance qualitatively/quantitatively in deployment-similar conditions.

Measure Outcome

Security and Resilience Evaluation

Security and resilience of the AI system are regularly evaluated and documented based on identified threats.

Measure Outcome

Transparency and Accountability Risks

Risks associated with GAI transparency and accountability are documented and mitigated.

Measure Outcome

Additional Tasks Coming Soon

0 attacks · 0 models

Models

Attacks

Options

Est. time ~ 1 min · Mode Chatbot

Ready to run 0 tests on 0 model(s).

Auditor

Agent Architecture Visualization

Processing Repository...

Agent Scan Failed, Please Try again.

Select Attacks

AI Security Risks & Threats

LLM Vulnerabilities

Agent Security

MCP Tool Risks

Code Vulnerabilities

Privacy Exposure

Harmful Content

GenAI RMF

NIST CSF

OWASP Top 10

ATLAS Matrix

Prompt Exfiltration

Jailbreaking

Self-Modification

Covert Channel

EU AI Act: general-purpose AI obligations kick in from 2 August 2025, what does that mean in practice?

The Inspect Sandboxing Toolkit: Scalable and secure AI agent evaluations

Research shows AI agents are highly vulnerable to hijacking attacks

Trump cuts to science research threaten his administration’s own AI action plan

OpenAI Designed GPT-5 to Be Safer. It Still Outputs Gay Slurs

Agent Privilege Escalation

Inter-Agent Communication

Credential Exposure

Recursive Execution

Training Data Poisoning

Data Leakage

Model Extraction

Adversarial Examples

Hydro

Hydro Console Assistant

Auditor

Agent Architecture Visualization

Processing Repository...

Agent Scan Failed, Please Try again.

AI Security Risks & Threats

LLM Vulnerabilities

Agent Security

MCP Tool Risks

Code Vulnerabilities

Privacy Exposure

Harmful Content

GenAI RMF

NIST CSF

OWASP Top 10

ATLAS Matrix

Prompt Exfiltration

Jailbreaking

Self-Modification

Covert Channel

EU AI Act: general-purpose AI obligations kick in from 2 August 2025, what does that mean in practice?

The Inspect Sandboxing Toolkit: Scalable and secure AI agent evaluations

Research shows AI agents are highly vulnerable to hijacking attacks

Trump cuts to science research threaten his administration’s own AI action plan

OpenAI Designed GPT-5 to Be Safer. It Still Outputs Gay Slurs

Agent Privilege Escalation

Inter-Agent Communication

Credential Exposure

Recursive Execution

Training Data Poisoning

Data Leakage

Model Extraction

Adversarial Examples

📋 Selected Tasks Payload

Task Details

API Examples

Previous APIs

Hydro

Hydro Console Assistant