Gleitkommazahlen sollten keine equals-Methode haben!

vorhergehende Artikel in: Java Numerik
05.07.2015

Manche Java-Programmierer ärgerten sich - zumindest bis Java 7 - immer wieder über die Tatsache, dass Fundamentaldatentypen oder Simple Types nicht nativ in Collections unterstützt werden. Mit der Addition von Auto-(Un)Boxing wurde das zwar etwas einfacher, gleichzeitig wurden aber neue Stolpersteine eingeführt. Ich sehe dieses als gute Gelegenheit, an die Auswirkungen von Machine-Epsilons erinnert zu werden...

Man mag manchmal dazu versucht sein, Doubles oder Floats als Schlüssel in Maps einzusetzen oder Sets dazu zu missbrauchen, zu checken, ob ein bestimmter Gleitkommawert bereits aufgetreten ist.

Das ist aus dem Blickwinkel der begrenzten numerischen Trennschärfe der gängigen Gleitkommatypen auf digitaler Hardware keine gute Idee: Berechnet man das Machine Epsilon in Java und versucht dann, eine 1 und eine 1 addiert um die Hälfte des Machine Epsilon voneinander zu unterscheiden, schlägt das fehl:

		double machEps = 1.0;
		do
		{
			machEps /= 2.0;
		}
		while ((double) (1.0 + (machEps / 2.0)) != 1.0);
		System.out.println("machine Epsilon= "+machEps);
		machEps /= 2.0;
		Double a = new Double(1);
		Double b = new Double(a.doubleValue() + machEps);
		java.util.Set doubles = new java.util.HashSet();
		doubles.add(a);
		System.out.println(doubles.contains(b));
Es sei darauf verwiesen, dass auch die Klasse BigDecimal dieses Problem nicht löst. Versucht man ein Machine Epsilon dafür zu errechnen, stellt man fest, dass die Berechnung
		java.math.BigDecimal machEpsBD = new java.math.BigDecimal(1.0);
		java.math.BigDecimal sum=null;
		int loop=0;
		do
		{
			machEpsBD = machEpsBD.divide(java.math.BigDecimal.ONE.add(java.math.BigDecimal.ONE));
//			if(loop%1000==0)
//				System.out.println(loop+" "+machEpsBD.scale());
//			++loop;
			sum=java.math.BigDecimal.ONE.add(machEpsBD.divide(java.math.BigDecimal.ONE.add(java.math.BigDecimal.ONE)));
		}
		while (sum.equals(java.math.BigDecimal.ONE)==false);
		System.out.println("machine Epsilon (BigDecimal)= "+machEpsBD);
sehr viel länger dauert und könnte versucht sein, zu jubeln, dass es hier kein Machine Epsilon gibt - und damit kein Trennschärfeproblem. Liest man sich jedoch die Dokumentation der Klasse durch, stellt man fest, dass das Machine-Epsilon bei der Verwendung von BigDecimal lediglich sehr viel kleiner ist - es verschwindet durch deren Einsatz nicht:

Immutable, arbitrary-precision signed decimal numbers. A BigDecimal consists of an arbitrary precision integer unscaled value and a 32-bit integer scale. If zero or positive, the scale is the number of digits to the right of the decimal point.

Das bedeutet, wenn der Wert für scale bei dem durch die festgelegten 32 Bit angekommen ist, tritt das Problem wieder auf! Die Tatsache, dass der Wert bei der Suche nach dem Machine Epsilon stetig steigt, kann man erkennen, wenn man die auskommentierten Zeilen im obigen Quelltextschnipsel aktiviert.

Man sieht daran auch wunderschön, wie sich die Komplexität der Berechnungen mit BigDecimals unter Java mit steigender Anzahl Nachkommastellen erhöht.

Lizenz
Quelltext

Artikel, die hierher verlinken

Mathematik mit beliebiger Präzision in Java

11.11.2018

Wann immer ich hier über Experimente mit numerischen Lösungsverfahren für Differentialgleichungssysteme berichte, habe ich im Hinterkopf, dass diese Verfahren eigentlich völlig ungeeignet dafür sind, solche Systeme zu analysieren, da heutige Digitalcomputer bereits rationale Zahlen nicht exakt darstellen können - von irrationalen ganz zu schweigen...

Datenbank-Migration: Checkliste

13.07.2015

Ich fasse hier mal die Gedanken zusammen, die als Grundlage einer Checkliste bei der Migration einer bestehenden Datenbank dienen können. Das ist mehr eine Merkliste für mich, die ich hin und wieder ergänzen werde...

Alle Artikel rss Wochenübersicht Monatsübersicht Github Repositories Gitlab Repositories Mastodon Über mich home xmpp


Vor 5 Jahren hier im Blog

  • Certstream, InfluxDB, Grafana und Netflix

    16.04.2019

    Nachdem ich vor kurzem über mein erstes Spielen mit dem certstream berichtete, habe ich weitere Experimente gemacht und die Daten zur besseren Auswertung in eine InfluxDB gepackt, um sie mit Grafana untersuchen zu können.

    Weiterlesen...

Neueste Artikel

  • Die sQLshell ist nun cloudnative!

    Die sQLshell hat eine weitere Integration erfahren - obwohl ich eigentlich selber nicht viel dazu tun musste: Es existiert ein Projekt/Produkt namens steampipe, dessen Slogan ist select * from cloud; - Im Prinzip eine Wrapperschicht um diverse (laut Eigenwerbung mehr als 140) (cloud) data sources.

    Weiterlesen...
  • LinkCollections 2024 III

    Nach der letzten losen Zusammenstellung (für mich) interessanter Links aus den Tiefen des Internet von 2024 folgt hier gleich die nächste:

    Weiterlesen...
  • Funktionen mit mehreren Rückgabewerten in Java

    Da ich seit nunmehr einem Jahr bei meinem neeun Arbeitgeber beschäftigt und damit seit ungefähr derselben Zeit für Geld mit Python arbeite, haben sich gewisse Antipathien gegenüber Python vertieft (ich kann mit typlosen Sprachen einfach nicht umgehen) - aber auch einige meiner Gründe, Python zu lieben sind ebenso stärker geworden. Einer davon ist der Fakt, dass eine Methode in Python mehr als einen Wert zurückgeben kann.

    Weiterlesen...

Manche nennen es Blog, manche Web-Seite - ich schreibe hier hin und wieder über meine Erlebnisse, Rückschläge und Erleuchtungen bei meinen Hobbies.

Wer daran teilhaben und eventuell sogar davon profitieren möchte, muß damit leben, daß ich hin und wieder kleine Ausflüge in Bereiche mache, die nichts mit IT, Administration oder Softwareentwicklung zu tun haben.

Ich wünsche allen Lesern viel Spaß und hin und wieder einen kleinen AHA!-Effekt...

PS: Meine öffentlichen GitHub-Repositories findet man hier - meine öffentlichen GitLab-Repositories finden sich dagegen hier.