内容


面向 Java 开发人员的 db4o 指南

超越简单对象

使用 db4o 创建、更新与删除结构化对象

Comments

系列内容:

此内容是该系列 # 部分中的第 # 部分: 面向 Java 开发人员的 db4o 指南

敬请期待该系列的后续内容。

此内容是该系列的一部分:面向 Java 开发人员的 db4o 指南

敬请期待该系列的后续内容。

一段时间以来,在 面向 Java 开发人员的 db4o 指南 中,我查看了各种使用 db4o 存储 Java 对象的方法,这些方法都不依赖映射文件。 使用原生对象数据库的其中一个优点就是可以避免对象关系映射(也许这不是重点),但我曾用于阐述这种优点的对象模型过于简单,绝大多数企业系统要求创建并操作相当复杂的对象,也称为结构化对象,因此本文将讨论结构化对象的创建。

结构化对象 基本上可以看成是一个引用其他对象的对象。尽管 db4o 允许对结构化对象执行所有常用的 CRUD 操作,但是用户却必须承受一定的复杂性。本文将探究一些主要的复杂情况(比如无限递归、层叠行为和引用一致性),以后的文章还将深入探讨更加高级的结构化对象处理问题。作为补充,我还将介绍探察测试(exploration test):一种少为人知的可测试类库 db4o API 的测试技术。

从简单到结构化

清单 1 重述了我在介绍 db4o 时一直使用的一个简单类 Person

清单 1. Person
package com.tedneward.model;

public class Person
{
    public Person()
    { }
    public Person(String firstName, String lastName, int age, Mood mood)
    {
        this.firstName = firstName;
        this.lastName = lastName;
        this.age = age;
        this.mood = mood;
    }
    
    public String getFirstName() { return firstName; }
    public void setFirstName(String value) { firstName = value; }
    
    public String getLastName() { return lastName; }
    public void setLastName(String value) { lastName = value; }
    
    public int getAge() { return age; }
    public void setAge(int value) { age = value; }
    
    public Mood getMood() { return mood; }
    public void setMood(Mood value) { mood = value; }

    public String toString()
    {
        return 
            "[Person: " +
            "firstName = " + firstName + " " +
            "lastName = " + lastName + " " +
            "age = " + age + " " + 
            "mood = " + mood +
            "]";
    }
    
    public boolean equals(Object rhs)
    {
        if (rhs == this)
            return true;
        
        if (!(rhs instanceof Person))
            return false;
        
        Person other = (Person)rhs;
        return (this.firstName.equals(other.firstName) &&
                this.lastName.equals(other.lastName) &&
                this.age == other.age);
    }
    
    private String firstName;
    private String lastName;
    private int age;
    private Mood mood;
}

这个简单的 Person 类在用于介绍基本 db4o 存储、查询和检索数据操作时行之有效,但它无法满足真实世界中企业编程的复杂性。 举例而言,数据库中的 Person 有家庭地址是很正常的。有些情况下,还可能需要配偶以及子女。

若要在数据库里加一个 “Spouse” 字段,这意味着要扩展 Person,使它能够引用 Spouse 对象。假设按照某些业务规则,还需要添加一个 Gender 枚举类型及其对应的修改方法,并在构造函数里添加一个 equals() 方法。在清单 2 中,Person 类型有了配偶字段和对应的 get/set 方法对,此时还附带了某些业务规则:

清单 2. 这个人到了结婚年龄吗?
package com.tedneward.model;
public class Person {
    // . . .

    public Person getSpouse() { return spouse; }
    public void setSpouse(Person value) { 
        // A few business rules
        if (spouse != null)
            throw new IllegalArgumentException("Already married!");
        
        if (value.getSpouse() != null && value.getSpouse() != this)
            throw new IllegalArgumentException("Already married!");
            
        spouse = value; 
        
        // Highly sexist business rule
        if (gender == Gender.FEMALE)
            this.setLastName(value.getLastName());

        // Make marriage reflexive, if it's not already set that way
        if (value.getSpouse() != this)
            value.setSpouse(this);
    }
    
    private Person spouse;    
}

清单 3 中的代码创建了两个到达婚龄的 Person,代码和您预想的很接近:

清单 3. 去礼堂,要结婚了……
import java.util.*;
import com.db4o.*;
import com.db4o.query.*;
import com.tedneward.model.*;

public class App
{
    public static void main(String[] args)
        throws Exception
    {
        ObjectContainer db = null;
        try
        {
            db = Db4o.openFile("persons.data");

            Person ben = new Person("Ben", "Galbraith", 
                Gender.MALE, 29, Mood.HAPPY);
            Person jess = new Person("Jessica", "Smith", 
                Gender.FEMALE, 29, Mood.HAPPY);
            
            ben.setSpouse(jess);
            
            System.out.println(ben);
            System.out.println(jess);
            
            db.set(ben);
            
            db.commit();
            
            List<Person> maleGalbraiths = 
                db.query(new Predicate<Person>() {
                    public boolean match(Person candidate) {
                        return candidate.getLastName().equals("Galbraith") &&
                                candidate.getGender().equals(Gender.MALE);
                    }
                });
            for (Person p : maleGalbraiths)
            {
                System.out.println("Found " + p);
            }
        }
        finally
        {
            if (db != null)
                db.close(); 
        }
    }
}

开始变得复杂了

除了讨厌的业务规则之外,有几个重要的情况出现了。首先,当对象 ben 存储到数据库后,OODBMS 除了存储一个对象外,显然还做了其他一些事情。 再次检索 ben 对象时,与之相关的配偶信息不仅已经存储而且还被自动检索。

思考一下,这包含了可怕的暗示。尽管可以想见 OODBMS 是如何避免无限递归 的场景, 更恐怖的问题在于,设想一个对象有着对其他 几十个、成百上千个对象的引用,每个引用对象又都有着 其自身对其他对象的引用。不妨考虑一下模型表示子女、双亲等的情景。 仅仅是从数据库中取出一个 Person 就会导致 追溯到所有人类的源头。这意味着在网络上传输大量对象!

幸运的是,除了那些最原始的 OODBMS,几乎所有的 OODBMS 都已解决了这个问题,db4o 也不例外。

db4o 的探察测试

考察 db4o 的这个领域是一项棘手的任务,也给了我一个机会 展示一位好友教给我的策略:探察测试。(感谢 Stu Halloway,据我所知,他是第一个拟定该说法的人。) 探察测试,简要而言,是一系列单元测试,不仅测试待查的库,还可探究 API 以确保库行为与预期一致。该方法具有一个有用的副作用,未来的库版本可以放到探察测试代码中,编译并且测试。如果代码不能编译或者无法通过所有的探察测试,则显然意味着库没有做到向后兼容,您就可以在用于生产系统之前发现这个问题。

对 db4o API 的探察测试使我能够使用一种 “before” 方法来创建数据库并使用 Person 填充数据库,并使用 “after” 方法来删除数据库并消除测试过程中发生的误判(false positive)。若非如此,我将不得不记得每次手工删除 persons.data 文件。 坦白说,我并不相信自己在探索 API 的时候还能每次都记得住。

我在进行 db4o 探察测试时,在控制台模式使用 JUnit 4 测试库。写任何测试代码前,StructuredObjectTest 类如清单 4 所示:

清单 4. 影响 db4o API 的测试
import java.io.*;
import java.util.*;
import com.db4o.*;
import com.db4o.query.*;
import com.tedneward.model.*;

import org.junit.Before;
import org.junit.After; 
import org.junit.Ignore; 
import org.junit.Test; 
import static org.junit.Assert.*;

public class StructuredObjectsTest
{
    ObjectContainer db;

    @Before public void prepareDatabase()
    {
        db = Db4o.openFile("persons.data");

        Person ben = new Person("Ben", "Galbraith", 
            Gender.MALE, 29, Mood.HAPPY);
        Person jess = new Person("Jessica", "Smith", 
            Gender.FEMALE, 29, Mood.HAPPY);
    
        ben.setSpouse(jess);
    
        db.set(ben);
    
        db.commit();
    }
    
    @After public void deleteDatabase()
    {
        db.close();
        new File("persons.data").delete();
    }


    @Test public void testSimpleRetrieval()
    {
        List<Person> maleGalbraiths = 
            db.query(new Predicate<Person>() {
                public boolean match(Person candidate) {
                    return candidate.getLastName().equals("Galbraith") &&
                            candidate.getGender().equals(Gender.MALE);
                }
            });
            
        // Should only have one in the returned set
        assertEquals(maleGalbraiths.size(), 1);

        // (Shouldn't display to the console in a unit test, but this is an
        // exploration test, not a real unit test)
        for (Person p : maleGalbraiths)
        {
            System.out.println("Found " + p);
        }
    }
}

自然,针对这套测试运行 JUnit 测试运行器会生成预计输出:要么是“.”,要么是绿条,这与所选择的测试运行器有关(控制台或 GUI)。注意,一般不赞成向控制台写数据 —— 应该用断言进行验证,而不是用眼球 —— 不过在探察测试里,做断言之前看看得到的数据是个好办法。如果有什么没通过,我总是可以注释掉 System.out.println 调用。(可以自由地添加,以测试您想测试的其他 db4o API 特性。)

从这里开始,假定清单 4 中的测试套件包含了代码示例和测试方法(由方法签名中的 @Test 注释指明。)。

存取结构化对象

存储结构化对象很大程度上和以前大部分做法一样:对对象调用 db.set(),OODBMS 负责其余的工作。对哪个对象调用 set() 并不重要,因为 OODBMS 通过对象标识符(OID)对对象进行了跟踪(参阅 “面向 Java 开发人员的 db4o 指南:查询、更新以及一致性”),因此不会对同一对象进行两次存储。

Retrieving 结构化对象则令我不寒而栗。如果要检索的对象(无论是通过 QBE 或原生查询) 拥有大量对象引用,而每个被引用的对象也有着大量的对象引用,以此类推。这有一点像糟糕的 Ponzi 模式,不是吗?

避免无限递归

不管大多数开发者的最初反应(一般是 “不可能是这样的吧,是吗?”)如何, 无限递归在某种意义上正是 db4o 处理结构化对象的真正方式。事实上,这种方式是绝大多数程序员希望的,因为我们都希望在寻找所创建的对象时,它们正好 “就在那里”。同时,我们也显然不想通过一根线缆获得整个世界的信息,至少不要一次就得到。

db4o 对此采用了折衷的办法,限制所检索的对象数量,使用称为激活深度(activation depth)的方法,它指明在对象图中进行检索的最低层。换句话说,激活深度表示从根对象中标识的引用总数,db4o 将在查询中遍历根对象并返回结果。在前面的例子中,当检索 Ben 时,默认的激活深度 5 足够用于检索 Jessica,因为它只需要 仅仅一个引用遍历。任何距离 Ben 超过 5 个引用的对象将无法 被检索到, 它们的引用将置为空。我的工作就是 显式地从数据库激活那些对象,在 ObjectContainer 使用 activate() 方法。

如果要改变默认激活深度, 需要以一种精密的方式,在 Configuration 类(从 db.configure() 返回)中使用 db4o 的 activationDepth() 方法修改默认值。 还有一种方式,可以对每个类配置激活深度。 在清单 5 中,使用 ObjectClassPerson 类型配置默认激活深度:

清单 5. 使用 ObjectClass 配置激活深度
// See ObjectClass for more info
Configuration config = Db4o.configure();
ObjectClass oc = config.objectClass("com.tedneward.model.Person");
oc.minimumActivationDepth(10);

更新结构化对象

更新所关注的是另外一个问题:如果在对象图中更新一个对象,但并没有做显式设置, 那么会发生什么?正如最初调用 set() 时,将存储引用了其他存储对象的相关对象,与之相似, 当一个对象传递到 ObjectContainer,db4o 遍历所有引用,将发现的对象存储到数据库中,如清单 6 所示:

清单 6. 更新被引用的对象
@Test public void testDependentUpdate()
{
    List<Person> maleGalbraiths = 
        db.query(new Predicate<Person>() {
            public boolean match(Person candidate) {
                return candidate.getLastName().equals("Galbraith") &&
                        candidate.getGender().equals(Gender.MALE);
            }
        });
        
    Person ben = maleGalbraiths.get(0);
        
    // Happy birthday, Jessica!
    ben.getSpouse().setAge(ben.getSpouse().getAge() + 1);

    // We only have a reference to Ben, so store that and commit
    db.set(ben);
    db.commit();

    // Find Jess, make sure she's 30
    Person jess = (Person)db.get(
            new Person("Jessica", "Galbraith", null, 0, null)).next();
    assertTrue(jess.getAge() == 30);
}

尽管已经对 jess 对象做了变动, ben 对象还拥有对 jess 的引用。因此内存中 jess Person 的更新会保存在数据库中。

其实不是这样。好的,我刚才是在撒谎。

测试误判

事实是,探察测试在某个地方出问题了,产生了一个误判。 尽管从文档来看并不明显, ObjectContainer 保持着已激活对象的缓存, 所以当清单 6 中的测试从容器中检索 Jessica 对象时,返回的是 包含变动的内存对象,而不是写到磁盘上真正数据。 这掩盖了一个事实,某类型的默认更新深度 是 1, 意味着只有原语值(包括 String)才会在调用 set() 时被存储。为了使该行为生效,我必须稍微修改一下测试,如清单 7 所示:

清单 7. 测试误判
@Test(expected=AssertionError.class)
public void testDependentUpdate()
{
    List<Person> maleGalbraiths = 
        db.query(new Predicate<Person>() {
            public boolean match(Person candidate) {
                return candidate.getLastName().equals("Galbraith") &&
                        candidate.getGender().equals(Gender.MALE);
            }
        });
            
    Person ben = maleGalbraiths.get(0);
    assertTrue(ben.getSpouse().getAge() == 29);
    
    // Happy Birthday, Jessica!
    ben.getSpouse().setAge(ben.getSpouse().getAge() + 1);

    // We only have a reference to Ben, so store that and commit
    db.set(ben);
    db.commit();
        
    // Close the ObjectContainer, then re-open it
    db.close();
    db = Db4o.openFile("persons.data");

    // Find Jess, make sure she's 30
    Person jess = (Person)db.get(
            new Person("Jessica", "Galbraith", null, 0, null)).next();
    assertTrue(jess.getAge() == 30);
}

测试时,得到 AssertionFailure, 说明此前有关对象图中层叠展开的对象更新的论断是错误的。(通过将您希望抛出异常的类类型的 @Test 注释的值设置为 expected,可以使 JUit 提前预测到这种错误。)

设置层叠行为

Db4o 仅仅返回缓存对象,而不对其更多地进行隐式处理,这是一个有争议的话题。 很多编程人员认为 要么这种行为是有害的并且违反直觉,要么 这种行为正是 OODBMS 应该做的。不要去管这两种观点优劣如何, 重要的是理解数据库的默认行为并且知道如何修正。在清单 8 中,使用 ObjectClass.setCascadeOnUpdate() 方法为一特定类型改变 db4o 的 默认更新动作。不过要注意,在打开 ObjectContainer 之前,必须 设定该方法为 true。清单 8 展示了修改后的正确的层叠测试。

清单 8. 设置层叠行为为 true
@Test
public void testWorkingDependentUpdate()
{
    // the cascadeOnUpdate() call must be done while the ObjectContainer 
    // isn't open, so close() it, setCascadeOnUpdate, then open() it again
    db.close();
    Db4o.configure().objectClass(Person.class).cascadeOnUpdate(true);
    db = Db4o.openFile("persons.data");

    List<Person> maleGalbraiths = 
        db.query(new Predicate<Person>() {
            public boolean match(Person candidate) {
                return candidate.getLastName().equals("Galbraith") &&
                        candidate.getGender().equals(Gender.MALE);
            }
        });
           
    Person ben = maleGalbraiths.get(0);
    assertTrue(ben.getSpouse().getAge() == 29);
        
    // Happy Birthday, Jessica!
    ben.getSpouse().setAge(ben.getSpouse().getAge() + 1);

    // We only have a reference to Ben, so store that and commit
    db.set(ben);
    db.commit();
        
    // Close the ObjectContainer, then re-open it
    db.close();
        
    db = Db4o.openFile("persons.data");

    // Find Jess, make sure she's 30
    Person jess = (Person)db.get(
            new Person("Jessica", "Galbraith", null, 0, null)).next();
    assertTrue(jess.getAge() == 30);
}

不仅可以为更新设置层叠行为,也可以对检索(创建值为 “unlimited” 的激活深度)和删除设置层叠行为 —— 这是我最新琢磨的 Person 对象的最后一个应用 。

删除结构化对象

从数据库中删除对象与检索和更新对象类似: 默认情况下,删除一个对象时,不删除它引用的对象。 一般而言,这也是理想的行为。如清单 9 所示:

清单 9. 删除结构化对象
@Test
public void simpleDeletion()
{
  Person ben = (Person)db.get(new Person("Ben", "Galbraith", null, 0, null)).next();
  db.delete(ben);
        
  Person jess = (Person)db.get(new Person("Jessica", "Galbraith", null, 0, null)).next();
  assertNotNull(jess);
}

但是,有些时候在删除对象时,希望强制删除其引用的对象。 与激活和更新一样, 可以通过调用 Configuration 类触发此行为。如清单 10 所示:

清单 10. Configuration.setCascadeOnDelete()
@Test
public void cascadingDeletion()
{
    // the cascadeOnUpdate() call must be done while the ObjectContainer 
    // isn't open, so close() it, setCascadeOnUpdate, then open() it again
    db.close();
    Db4o.configure().objectClass(Person.class).cascadeOnDelete(true);
    db = Db4o.openFile("persons.data");

    Person ben = 
        (Person)db.get(new Person("Ben", "Galbraith", null, 0, null)).next();
    db.delete(ben);
        
    ObjectSet<Person> results = 
        db.get(new Person("Jessica", "Galbraith", null, 0, null));
    assertFalse(results.hasNext());
}

执行该操作时要小心,因为它意味着其他引用了被消除层叠的对象的对象将拥有一个对 null 的引用 —— db4o 对象数据库在防止删除被引用对象上使用的引用一致性 在这里没有什么作用。 (引用一致性是 db4o 普遍需要的特性,据说开发团队正在考虑在未来某个版本中加入这一特性。对于使用 db4o 的开发人员来说,关键在于要以一种不违反最少意外原则 的方式实现,甚至某些时候, 即使是在关系数据库中, 打破一致性规则实际上也是一种理想的实践。)

结束语

本文是该系列文章的分水岭:在此之前, 我使用的所有示例都基于非常简单的对象,从应用角度来讲, 那些例子都不现实,其主要作用只是为了使您理解 OODBMS,而不是被存储的对象。 理解像 db4o 这样的 OODBMS 是如何通过引用存储相关对象,是比较复杂的事情。 幸运的是,一旦您掌握了这些行为(通过解释和理解),您所要做的就只是 开始调整代码来实现这些行为。

在本文中,您看到了一些基本例子,通过调整复杂代码来实现 db4o 对象模型。 学习了如何对结构化对象执行一些简单 CRUD 操作,同时,也看到了一些 不可避免的问题和解决方法。

其实,目前的结构化对象例子仍然比较简单, 对象之间还只是直接引用关系。 许多夫妻都知道,结婚一段时间后,孩子将会出现。 本系列的下一文章中,我将继续 探索 db4o 中的结构化对象的创建与操作,看看在引入若干子对象后, benjess 对象将发生什么。


相关主题


评论

添加或订阅评论,请先登录注册

static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=10
Zone=Java technology, Open source
ArticleID=239274
ArticleTitle=面向 Java 开发人员的 db4o 指南: 超越简单对象
publish-date=07092007