all for one & one for ram

ram deduplication
for ai infrastructure. RAM-Deduplizierung
für KI-Infrastruktur.

Native Linux system software that deduplicates shared libraries across AI workloads — recovering tens to hundreds of gigabytes of RAM per server, with no model changes and bit-identical results. Native Linux-Systemsoftware, die Shared Libraries über AI-Workloads hinweg dedupliziert — und so Dutzende bis Hunderte Gigabyte RAM pro Server freigibt, ohne Modellanpassung und mit bit-identischen Ergebnissen.

See how it worksFunktionsweise ansehen →

nexives@gpu-node-04 · ~ live

$ nexives scan --report

[12:43:08] scanning /usr/lib, /opt, ~/.venv … 7142 files

[12:43:23] sha256 fingerprints computed

[12:43:36] dedup map built — 528 duplicates

[12:43:39] linking … 528/528 ok

────────────────────────────────

✓ scan complete · 31 s

RAM recovered: 19.83 GB

Inode reduction: 932 → 404

Status: ready

Real benchmark output. 4 LLM venvs on gpu-node-04, May 2026 — independently verifiable via Linux inode count. Echte Benchmark-Ausgabe. 4 LLM-venvs auf gpu-node-04, Mai 2026 — unabhängig über die Linux-Inode-Zählung verifizierbar.

Validated benchmark · May 2026Validiertes Benchmark · Mai 2026 | 19.83 GB recoveredfreigegeben · 31 s scanScan · 2.5 TB on a 10-node cluster10-Knoten-Cluster · 0 model changesModelländerungen

our missionunsere Mission

normalize
the ai stack. den KI-Stack
normalisieren.

acceleratebeschleunigen

78 % faster cold starts via ML-based prefetch. 78 % schnellere Cold-Starts via ML-basierten Prefetch.

economizeeinsparen

Save 50–250 GB of RAM per GPU server. 50–250 GB RAM pro GPU-Server einsparen.

deduplicatededuplizieren

Eliminate identical library copies across every environment. Identische Bibliothekskopien in jeder Umgebung eliminieren.

What it isWas es ist

a system layer between
your AI runtime and the kernel. Eine Systemschicht zwischen
Ihrer AI-Runtime und dem Kernel.

On every modern AI server, the same shared-library files sit in RAM dozens of times. Nexives replaces those duplicates with hard links to a single content-addressed store. The Linux kernel then shares the underlying RAM pages automatically. Auf jedem modernen AI-Server liegen dieselben Shared-Library-Dateien dutzendfach im RAM. Nexives ersetzt diese Duplikate durch Hard-Links auf einen einzigen content-adressierten Store. Der Linux-Kernel teilt anschließend die zugehörigen RAM-Seiten automatisch.

What it doesWas es tut

deduplicates .so files at the filesystem level dedupliziert .so-Dateien auf Dateisystem-Ebene

Hashes shared libraries with SHA-256, replaces duplicates with hard links to a single object store, and lets the kernel share RAM pages between all processes. Hasht Shared Libraries mit SHA-256, ersetzt Duplikate durch Hard-Links auf einen einzigen Object-Store und lässt den Kernel die RAM-Seiten zwischen allen Prozessen teilen.

What it doesn't touchWas es nicht anfasst

GPU memory, model weights, application code GPU-Speicher, Modellgewichte, Anwendungscode

No interference with VRAM, KV cache, datasets, Python objects or container layers. No code changes, no restarts, no configuration. Linux only. Kein Eingriff in VRAM, KV-Cache, Datensätze, Python-Objekte oder Container-Layer. Keine Code-Änderungen, keine Neustarts, keine Konfiguration. Linux-only.

Who it's forFür wen

GPU clouds, AI-first companies, hosting providers GPU-Clouds, AI-First-Unternehmen, Hosting-Provider

Anyone running multiple AI workloads on shared Linux hosts — or anyone running large fleets of customer VMs and containers on physical hardware. Jeder, der mehrere AI-Workloads auf gemeinsamen Linux-Hosts betreibt — oder große Flotten von Kunden-VMs und -Containern auf physischer Hardware.

How it worksFunktionsweise

four steps,
thirty-one seconds. Vier Schritte,
einunddreißig Sekunden.

Nexives is intentionally simple. It runs once, finds every duplicate shared-library file on the host, and turns each duplicate into a hard link to a single canonical copy. Nexives ist bewusst einfach. Es läuft einmal, findet jede doppelte Shared-Library-Datei auf dem Host und verwandelt jedes Duplikat in einen Hard-Link auf eine einzige kanonische Kopie.

SCAN

discover every .so filejede .so-Datei finden

A single agent enumerates every shared-library file across all venvs, containers and language runtimes. Typical fleet: 7 000+ files per host. Ein Agent enumeriert jede Shared-Library-Datei über alle venvs, Container und Runtimes. Typisch: 7 000+ Dateien pro Host.

HASH

compute SHA-256 fingerprintsSHA-256-Fingerabdrücke

Identical content yields an identical hash — ground-truth identity before any link operation. Identischer Inhalt erzeugt identischen Hash — eindeutige Identität vor jeder Link-Operation.

LINK

replace duplicates atomicallyDuplikate atomar ersetzen

Atomic os.link() + os.replace() to a single canonical object in /chive/libs/objects/. Idempotent and reversible. Atomar via os.link() + os.replace() auf ein kanonisches Objekt unter /chive/libs/objects/. Idempotent und reversibel.

kernel page sharingKernel-Page-Sharing

The Linux VFS page cache shares RAM pages between all processes — permanently, with zero ongoing CPU cost. Der VFS-Page-Cache teilt RAM-Seiten zwischen allen Prozessen — dauerhaft, ohne laufende CPU-Kosten.

User processes (Python, Java, Node)Benutzerprozesse (Python, Java, Node)N processes

Linux VFS page cacheLinux VFS-Page-Cacheshared RAM

Nexives · hard-link layerNexives · Hard-Link-Schichtour scope

/chive/libs/objects/ (content-addressed)/chive/libs/objects/ (content-adressiert)single copy

Filesystem (ext4, xfs, btrfs)Dateisystem (ext4, xfs, btrfs)block device

Where it mattersWo es zählt

three customers,
one technology. Drei Kunden,
eine Technologie.

Wherever multiple Linux processes load the same shared libraries, Nexives recovers RAM. The economics scale with workload density. Überall, wo mehrere Linux-Prozesse dieselben Shared Libraries laden, gewinnt Nexives RAM zurück. Die Ökonomie skaliert mit der Workload-Dichte.

GPU cloudsGPU-Clouds

multi-tenant inference at scaleMulti-Tenant-Inference im Großmaßstab

Each tenant runs its own PyTorch / vLLM venv. Hundreds of duplicate libtorch_cpu.so, libcudart.so, libnvinfer.so — collapsed to one copy in RAM per node. Jeder Tenant betreibt sein eigenes PyTorch- / vLLM-venv. Hunderte duplizierte libtorch_cpu.so, libcudart.so, libnvinfer.so — reduziert auf eine Kopie pro Knoten.

~250 GB

per node, 50 venvspro Knoten, 50 venvs

AI-first enterprisesAI-First-Unternehmen

in-house training and inferenceEigene Training- und Inference-Cluster

Capacity that would otherwise require additional hardware procurement — reclaimed in a 31-second scan, with no operational disruption. Kapazität, die anderenfalls zusätzliche Hardware-Beschaffung erfordern würde — in 31 Sekunden zurückgewonnen, ohne operative Störung.

2.5 TB

10-node cluster10-Knoten-Cluster

Hosting providersHosting-Provider

infrastructure editionInfrastructure Edition

Sell 5–15 % more customer capacity per physical host. Same hardware. Same Linux. New revenue line. Verkaufen Sie 5–15 % mehr Kundenkapazität pro physischem Host. Selbe Hardware. Selbes Linux. Neue Umsatzlinie.

200 TB

across 10 000 hostsüber 10 000 Hosts

AboutÜber uns

a small team,
built for the system layer. Ein kleines Team,
gebaut für die Systemschicht.

Nexives is founded by engineers with deep experience in Linux internals, AI infrastructure and enterprise software. We have spent years operating the systems we now build for — and started this company because the memory layer beneath every modern AI workload was overdue for a rethink. Nexives wurde von Ingenieuren mit tiefer Erfahrung in Linux-Internals, AI-Infrastruktur und Enterprise-Software gegründet. Wir haben die Systeme, für die wir heute bauen, jahrelang selbst betrieben — und dieses Unternehmen gegründet, weil die Speicherschicht unter jeder modernen AI-Workload eine grundlegende Neugestaltung verdient.

Full team to be announced. Das vollständige Team wird in Kürze vorgestellt.

Frequently askedHäufige Fragen

questions worth answering up front. Fragen, die vorab geklärt gehören.

Does Nexives change inference results?Verändert Nexives Inferenzergebnisse?

No. Bit-identical. Files are replaced by hard links via atomic os.link() + os.replace(); page sharing is handled by the kernel — models see exactly the same bytes as in the reference run. Verifiable independently by Linux inode count. Nein. Bit-identisch. Dateien werden per Hard-Link über atomare os.link()- und os.replace()-Operationen ersetzt; das Page-Sharing übernimmt der Kernel — Modelle sehen exakt dieselben Bytes wie im Referenzlauf. Unabhängig über die Inode-Zählung verifizierbar.

What runtimes are supported?Welche Laufzeitumgebungen werden unterstützt?

Any Linux workload that loads shared-library (.so) files. Validated: PyTorch, vLLM, pip, conda, uv, CPython. Equivalent benefit: Java / JVM, Node.js native modules, Ruby, PHP, Go (with CGo). Jede Linux-Workload, die Shared-Library-Dateien (.so) lädt. Validiert: PyTorch, vLLM, pip, conda, uv, CPython. Gleichwertiger Nutzen: Java / JVM, Node.js native Module, Ruby, PHP, Go (mit CGo).

Is the kernel modified?Wird der Kernel verändert?

No kernel module, no patch, no custom build. Nexives runs entirely in userspace and uses the kernel's standard VFS page-sharing semantics. Compatible with mainline Linux on ext4, xfs and btrfs. Kein Kernel-Modul, kein Patch, kein Custom-Build. Nexives läuft vollständig im Userspace und nutzt die standardmäßigen VFS-Page-Sharing-Semantiken des Kernels. Kompatibel mit Mainline-Linux auf ext4, xfs und btrfs.

How does it scale across a cluster?Wie skaliert es über einen Cluster?

Each node runs Nexives independently. No shared storage, no cross-node dependency, no cluster-wide single point of failure. A lightweight Control Plane — one small VM — coordinates deployment, monitoring, licensing and compliance reporting across the fleet. Jeder Knoten betreibt Nexives unabhängig. Kein geteilter Speicher, keine knotenübergreifende Abhängigkeit, kein clusterweiter Single Point of Failure. Ein leichter Control Plane — eine kleine VM — koordiniert Deployment, Monitoring, Lizenzierung und Compliance-Reporting über die Flotte hinweg.

How is this different from Linux KSM?Wie unterscheidet es sich von Linux KSM?

KSM scans memory continuously, takes 30+ minutes per pass, burns CPU permanently, and is disabled by default in cross-tenant deployments due to side-channel attack risk. Nexives operates at the filesystem level, completes in 31 seconds, has zero ongoing CPU cost, and does not expose memory across tenants. KSM scannt kontinuierlich Speicher, benötigt 30+ Minuten pro Durchlauf, verbrennt permanent CPU und ist in Multi-Tenant-Deployments standardmäßig deaktiviert wegen Side-Channel-Risiken. Nexives arbeitet auf Dateisystem-Ebene, ist in 31 Sekunden fertig, hat null laufende CPU-Kosten und legt keinen Speicher tenantübergreifend offen.

What about Windows?Was ist mit Windows?

Linux only. Windows uses a fundamentally different memory model. Given that essentially all AI training and inference runs on Linux, this is intentional and not on the roadmap. Linux-only. Windows nutzt ein grundlegend anderes Speichermodell. Da praktisch das gesamte AI-Training und -Inference auf Linux läuft, ist dies bewusst gewählt und nicht auf der Roadmap.

ram deduplicationfor ai infrastructure. RAM-Deduplizierungfür KI-Infrastruktur.

normalizethe ai stack. den KI-Stacknormalisieren.

a system layer betweenyour AI runtime and the kernel. Eine System­schicht zwischenIhrer AI-Runtime und dem Kernel.